Sélectionner une page

Intelligence artificielle : Les LoRa’s

La révolution de Flux 1 continue : Ce nouveau moteur d’IA « text to image » dans le domaine public et non censuré (fondamental par les temps qui courent) enfonce toute concurrence. De plus en plus de services en ligne le proposent plus ou moins gratuitement comme nous allons le voir.

Au passage, pour ceux qui ne sont pas familiers de ces nouveaux outils, rappelons qu’il s’agit de générateurs d’images à partir d’un texte explicite (le prompt) rédigé en anglais. Mais ça marche aussi dans toutes les langues en faisant appel à des traducteurs, le plus souvent intégrés.

Aparté – La méthode classique consiste à taper le prompt en français, en « langage naturel », en décrivant au mieux l’image qu’on souhaite obtenir avec beaucoup de détails (couleurs, effets, focale, lumière, etc – sinon c’est le logiciel qui décide tout seul) et de passer ensuite par Claude, Mistral ou ChatGPT pour le traduire et l’adapter à l’IA. Mais il existe un nouvel outil qui fait tout cela très bien en ligne : Glif. Cadeau !

Utiliser Flux 1 dans le cloud

Flux 1 est donc dans le domaine public (gratuit) et peut être installé en local à condition d’être l’heureux possesseur d’une machine surpuissante. Mais même dans ce cas, impossible de rivaliser avec les fermes de rendu en ligne et il est bien plus pratique de faire appel à elles, même si cela à un coût.

On peut s’interroger sur le modèle économique choisi pour les versions Flux Schnell et Flux Dev (Flux Pro reste propriétaire – pas fous). En effet, qui dit domaine public dit gratuité bien sur mais aussi accès au code source et possibilité pour tout un chacun de proposer son usage en ligne et surtout de le modifier, ce qui va toujours dans le sens d’une amélioration.

Ainsi fonctionnent par exemple Blender 3D ou le système d’exploitation Linux, ou encore la plateforme GitHub parmi tant d’autres.

C’est pourquoi Blender bénéficie du plus grand nombre de fonctionnalités du monde de la 3D avec un rythme de mises à jour et d’améliorations sur une base pratiquement quotidienne. Grâce à des milliers de programmeurs passionnés.

C’est la même chose pour le célèbre Linux créé par Linus Torswald, un système d’exploitation (presque) parfait et qui fait la nique à ses concurrents payants (Windaube…)

Ce modèle économique ne doit rien au capitalisme basique et au matérialisme sauvage dont le crédo est : exploiter, produire, vendre et marger. Sans s’émouvoir des moyens nécessaires et de leur impact sur l’avenir. Vendre, vendre, vendre, à n’importe quel prix !

Et ces améliorations ne se sont pas fait attendre ! C’est ainsi que l’excellent Javi Lopez et ses coadjupiles viennent de mettre en ligne Mystic, un moteur de rendu encore plus performant qui a défrayé la chronique la semaine dernière et dont on dit qu’il serait un simple « pimp » de Flux 1. Gageons que les créateurs de Flux 1 sauront intégrer ces améliorations dans le version « Pro »…

Toujours est-il que cette nouvelle mouture sera déployée prochainement sur FreePik (en fait, ça y est, c’est en ligne !) moyennant un abonnement Pikaso.

Voici d’autres services en ligne où utiliser Flux 1 :

FAL AI : et son interface de création de LoRa. Nous allons revenir sur cette fondamentale notion des « LoRa »…

 

Replicate : avec une kyrielle d’outils pour créer des LoRa et même les utiliser immédiatement dans Replicate.

Hugging Face : qui fait tourner Flux et stocke vos LoRa. Incontournable acteur de l’IA à l’interface bien rébarbative comme il faut mais d’une puissance reconnue avec d’innombrables fonctionnalités (bien confuses). Il est par exemple possible d’un créer son espace pour y héberger sur le « cloud » les LoRa (fichiers d’apprentissage) réalisés sur d’autres plateformes. Grâce à un accès par « token » à renseigner dans les dites plateformes. C’est un espace collaboratif. Eviter d’y charger trop d’images personnelles !

Civit AI : Flux + LoRa.

 

 

 

Et quelques autres sites gratuits (pour combien de temps ?)…

FluxPro Art qui permet d’utiliser Flux Pro gratuitement à condition de laisser ses créations en mode public.

PicLumen 

 

 

 

Remix

Une seule taille, une seule définition mais une application pour le téléphone.

 

 

FastFlux

Site rapidement adapté de RunWare qui faisait tourner, lui, Stable Diffusion… Taille limitée et sortie en .webp mais rendu instantané !

Avec un prompt « fractal » du type : 3D fractal cube cross menger, AO, blue, cyan, gold, green backlight, bokeh, garden landscape background, 4K, 105mm

LoRa en pratique

Flux est un mastodonte qui embarque 12 milliards (!) de paramètres ce qui répond déjà à un nombre impressionnant de situations. Mais il est possible d’allez encore plus loin. Savez-vous ce que sont les LoRa ? Cet acronyme signifie low rank adaptation et est une innovation remarquable dans cette nouvelle science (20 à 30 ans d’age quand même) des réseaux neuronaux et du deep learning.

Pas de doute en effet que ces techniques soient utilisées depuis de nombreuses années par les gouvernements et leurs services secrets pour leurs expériences d’ingénierie sociale, la fabrique du consentement grâce au story telling, aux « éléments de langage » et aux fakes (documents texte, photos, vidéos…) de propagande et autres faux caractérisés…

Pour résumer simplement, il s’agit d’ajouter au logiciel une nouvelle couche grâce à un « fichier d’apprentissage » obtenu en traitant une quinzaine de photos d’une personne donnée ou d’un style particulier. Ensuite, il s’agit d’ajouter au prompt habituel un « trigger », mot clé appelant le LoRa nouvellement créé.

Dans un premier temps, le moteur scanne les photos grâce à un algorithme dédié et leur définit une première description textuelle, plus ou moins fantaisiste. En effet, il semble que mes fractales posent un sérieux problème d’identification. Ainsi, si plusieurs images sont correctement décrites, j’ai la surprise de découvrir que ma fractale « Nullarbor » est intitulée :

The image features a person in a black shirt and white pants, flying through the air with a surfboard. The person is surrounded by a blue sky, and there is a large tree in the background. The scene is captured in a unique, artistic style that showcases the beauty of the natural world.

Je ne vois pas ce que viennent faire une planche de surf et un arbre dans cette histoire…

 

 

Même chose avec « Corail rouge » où l’IA identifie mon corailleur comme un oiseau…

art fractal,Francis Le Guen,galerie art contemporain en ligne,décoration d’intérieur,oeuvres fractales,art fractal à vendre,décoration,vente tableaux,galerie d'art fractal,peinture fractaleThe image features a blue and red landscape with a bird flying in the middle of the scene. The bird is positioned towards the left side of the image and appears to be the main focal point. The background is filled with a mix of blue and red colors, creating a vibrant and dynamic atmosphere. The overall composition of the image is visually striking and captures the essence of fractalesFLGabysses’ style.

 

Mais, dans le cas de mon tableau « Banquise » il faut reconnaitre que l’expertise de l’IA est bluffante : elle a su reconnaitre de la glace et de la neige, de l’exploration et de l’aventure, même si elle fait encore allusion à une planche de surf (une obsession ?).

The image features a blue and white color scheme, with a sense of depth and complexity. A person is standing on a rock in the middle of the scene, surrounded by ice and snow. The person is wearing a backpack, and there is a surfboard nearby, suggesting that they may be exploring the icy landscape or preparing for an adventure. The overall composition of the image conveys a sense of adventure and exploration in a stunning, icy environment.

 

C’est ainsi que j’ai obtenu le fichier LoRa. Qu’il est ensuite facile d’insérer dans les paramètres de Flux1 pour générer de nouvelles images. Quand je règle l’influence du fichier au maximum (censé ne tenir compte que de ce fichier) le résultat est décevant : un salmigondis « fractal » sans aucun sens.

En diminuant cette influence, on renoue avec un certain réalisme mais on est loin encore de mes créations initiales…

art fractal,Francis Le Guen,galerie art contemporain en ligne,décoration d’intérieur,oeuvres fractales,art fractal à vendre,décoration,vente tableaux,galerie d'art fractal,peinture fractaleJe décide alors de crée un nouveau LoRa mais cette fois avec la même fractale vue sous différents angles.

Je choisis « Riviera Maya » puisque je disposais de plusieurs versions comme je l’expliquais dans ce post.

 

 

Un entrainement sur seulement 3 images ce qui est en principe insuffisant… Mais avec Flux 1 – Dev et ce nouveau LoRa et les réglages standards, j’obtenais satisfaction avec différents points de vue et formats dans ce monde biomécanique ! Des images parfaitement utilisables au prix de quelques retouches, ce qui est totalement « surnaturel »…

Tous ego !

Une autre façon d’utiliser les LoRa concerne les portraits « réalistes » et même les auto portraits. Flux 1 n’est pas censuré, nous l’avons dit, ce qui signifie qu’on peut générer des images avec dans le prompt des mentions de personnages publics, des politiques, des comédiens et autres « people » qui font partie de l’entrainement standard de ces IA. Ce qui pose un problème de droit à l’image : logiquement, ces personnages utilisés dans des situations souvent ridicules ou compromettantes ont le droit d’intenter des procès à la publication. Prudence, donc.

Raison pour laquelle il vaut mieux se recentrer sur soi-même, ses proches ou ses animaux de compagnie. Tout en se flattant l’ego dans le sens du poil ! En effet, si connus nous croyons-nous, il y a fort peu de chance qu’on fasse partie de l’entraînement standard. Et c’est là qu’un fichier LoRa entre en jeu. Avec Replicate et Hugging Face j’ai ainsi entrainé le logiciel avec une douzaine de photos personnelles. Avant de générer de nouvelles images grâce à un prompt dans lequel figure de mot clé de ce nouveau LoRa ; un fichier d’apprentissage qui enrichit le logiciel de base.

Le résultat est confondant… Sachant que je ne suis dans ces essais qu’à 30% du niveau de réalisme que je peux obtenir avec ces outils… Attention désormais à la notion de « réalité » ! Sans parler de la vidéo, que nous verrons dans un prochain billet.

In petto, je nous transportais dans une vénérable bibliothèque, avec la gravité nécessaire et quelques variations sur l’âge et l’embonpoint…

Et pourquoi pas faire une promo pour un livre qui n’existe pas encore ? Avec des verrières fractales…

Mouvements de fond

Dans la tourmente provoquée par Flux, les autres acteurs du secteur sont revenus à des options de gratuite (en attendant le libre ?). Ainsi, MidJourney qui a tourné le dos à Discord (une bonne chose) et qui propose désormais ses services sur un bête site web avec le retour de l’essai gratuit, à l’ouverture.

Egalement Ideogram, qui permet de générer gratuitement 10 images par jour. C’est ainsi que j’ai retrouvé sur leur serveur quelques images que j’avais testées sur Ideogram, il y a plus de 6 mois, depuis mon téléphone. Sans les avoir sauvegardées… Avec 2 prompts complémentaires, comme toujours sur ce moteur :

Prompt

underwater deep cavediving dark blue black small scubadiver, photo

Magic Prompt

A mesmerizing underwater photograph of a lone scuba diver in a dark blue and black wetsuit, exploring the depths of a deep-seacave. The diver is small in comparison to the vast, dark cavern with stalactites and mysterious bioluminescent creatures in the background. The water is a deep, dark blue, reflecting the absence of sunlight and the eerie atmosphere of the underwater world, photo

Et, dans un style « illustration » :

Prompt

underwater deep cave diving dark blue black, illustration

Magic Prompt

A stunning underwater illustration of deep cave diving, showcasing a diver ascending through a dark blue, abyssal cavern. The diver’s lamp casts a beam of light through the black waters, revealing an array of bioluminescent marine life. The background features an eerie yet beautiful fusion of deep blue and black hues, with stalactites and stalagmites lining the cavern walls. The overall atmosphere is one of mystery and wonder, as if the viewer has just discovered a hidden underwater world., illustration

D’autres nouveautés sont à attendre prochainement aussi du côté de Leonardo. Et bientôt des API ? 😉

 

Publié le Août 27, 2024

Voir le site pro ?

Tous les tableaux

Tous les articles

0 commentaires