Sélectionner une page

Pinokio et Flux : le meilleur de l’IA !

C’est une révolution dans l’utilisation de l’intelligence artificielle : l’arrivée de Flux, un moteur de même niveau voire encore meilleur que le célèbre Midjourney mais disponible dans le domaine public, c’est à dire gratuitement ! Et qui compte 12 milliards de paramètres !

Flux fiat !

Développé par les équipes de Black Forest Labs (le Stable Diffusion original), Flux se décline en trois variantes :

Flux Dev, qui est open-source avec une licence non commerciale pour le développement communautaire.

Flux Schnell, qui est une version plus rapide, « distillée » et fonctionnant jusqu’à dix fois plus vite, disponible sous une licence Apache 2.

Flux Pro, le modèle haut de gamme qui est une version à source fermée disponible via une API.

Les résultats, présentés sur le site des créateurs sont juste bluffants. Avec des « prompts » (texte générant une image) relativement simples.

 

Dans cette vidéo de Pixel Dojo, on retrouvera d’autres dithyrambes à propos de ce logiciel surdoué…

Pinokio

Toute la question est de savoir comment y accéder et surtout le faire tourner ! C’était déjà la croix et la bannière avec Stable Diffusion (désormais obsolète) et les mac’s restaient à la porte…

Heureusement est arrivé pinokio de cocktail peanut, un outil mis à disposition de tous par un génial jeune programmeur.

Mais qui est-il donc ? Je ne sais pas vous mais moi j’aime bien mettre un visage, un nom, voire un CV sur une réalisation logicielle réussie.

Mais le canaillou semble très discret et se cache derrière ses avatars sur l’Internet (GitHub, X, etc). Il semble même qu’il ait effacé toutes traces de son existence !

Où va se nicher la pudeur…

Mais j’ai fini par le débusquer ! A moins que ce ne soit pas lui… 🙂

Il s’agirait de Nigel Yong, un génial programmeur d’origine asiatique, né à l’île Maurice, bilingue français / anglais et établi à Montreal au Quebec…

 

En pratique

Le logiciel, très simple et multiplateforme, se présente comme un catalogue d’AI qu’il suffit de télécharger. Dès lors, il devient possible de faire tourner les AI les plus modernes et Open Source (comme Flux) sur sa propre machine !

Nigel (si c’est lui) s’est cogné la réalisation d’une interface de téléchargement en JavaScript qui fait tout automatiquement en chargeant tous les éléments nécessaires dans un seul et même dossier manipulable facilement.

Oh joie ! Ca marche aussi pour MacOS. Et même pour les dernières versions à puces Silicon M2 M3 (hybrides CPU / GPU) boudées par tant d’applications…

C’est alors que Pinokio passe en mode « terminal » et que les rébarbatives commandes Linux se mettent à défiler à l’écran, chargeant tous les logiciels qui nous manquent (et il y en a) comme Conda, HomeBrew, Python, Git, Zip et tant d’autres. Le Mac (qui est basé sur une architecture Unix) bascule en Linux ! Avant de charger le coeur du programme Flux.

 

Bon évidemment c’est très long : il faut compter plusieurs heures surtout en cas de mauvaises connexions comme à Honfleur où je séjourne actuellement chez mon père, sous les trombes d’eau du mois d’août…

On parle quand même de fichiers de près de 20 Go à charger ! De quoi générer des images, encore une fois, en local, sans appels à l’Internet.

Ce défilé supersonique de caractères abscons sur fond noir à de quoi inquiéter le profane mais, pour paraphraser un de nos ministres défroqués : « Ca va bien se passer ».

Ci-dessous, par exemple, l’installation de l’interface Comfy UI, autre flegmon logiciel pour lancer Flux en local.

 

Les premiers essais sont époustouflants ! Voici les résultats avec des prompts textuels où il est question de fatales créatures blondes brunes ou rousses, avec ou sans bandanas, et quelques autres complexités concernant la focale, l’ouverture du diaphragme, le style, les couleurs et autres positions d’éclairages… Oui, je sais, le masque de plongée est trop gros et mal fixé. C’est un essai vous dis-je ! 🙂

 

Mais ça, c’est la théorie. Pinokio marche parfaitement en temps que « catalogue » des UI. Rien à dire. On est bien contents. Mais il en va tout autrement quand on installe une ou plusieurs des applis proposées dans la page d’accueil, ce qui prend déjà des heures de téléchargement et une place considérable sur le disque. L’interface (WebUI) fini par apparaître sauf qu’il faut encore des heures pour faire apparaître la moindre image, quand elle apparait !

Après avoir bien cherché sur les forums d’aide X et Discord j’ai découvert que tout cela ne fonctionne que sur des Mac’s dernière génération (à puces Silicon M2 mais pas M3…) avec le dernier iOS (Sonoma 14.6.1) et des cartes graphiques monstrueuses (> 24 Go – mais pas plus sous peine qu’elle ne soit pas reconnue…) Sans oublier d’avoir installé préalablement l’environnement de dévellopement pour Mac, XCode. Le tout sans aucun message d’erreur de Pinokio avant de lancer une installation, si ce n’est d’absconses alertes en mode terminal (illisibles) lors de l’interminable chargement des modules (il en manque toujours un morceau qui refuse de s’installer). Bref, c’est théorique. Une fantaisie de geek, quoi, pour bidouilleurs avertis.

De toute façon la quantité de VRAM nécessaire est tellement élevée qu’elle limite cet exercice à un tout petit nombre de machines et de Mac’s hors de prix…

Répliquons !

Il existe bien sur d’autres solutions plus rationnelles pour faire tourner Flux. Dans le « cloud » notament grâce à des interfaces web comme le site replicate  par exemple qui est un aggrégateur de moteurs d’IA divers et variés. Le nouveau Flux en fait partie.

Comme toujours, après un court essai gratuit interviennent les options payantes mais pour un prix modeste, semble-t-il. Quoiqu’on n’y comprenne rien : Il y a un prix pour le temps machine (imaginez les immenses serveurs du cloud avec leurs gymnases remplis d’ordinateurs surpuissants munis de cartes graphiques rougeoyantes, moulinant les données rien que pour vous), un prix par type de processeur, un prix par moteur d’AI différente, une autre somme par image affichée.  J’ai lu quelque part (mais ne le répétez pas) qu’il en coûterait 1 $ pour générer 33 images avec Flux Pro ou 333 images avec Flux Schell… Bref.

Ce qui est sûr c’est que l’on n’est taxé que lorsque qu’on se sert du bazar. Ce qui est sûr également c’est qu’on doit rentrer un numéro de carte bleue pour pouvoir jouer. Que le racket commence !

On peut s’abonner aussi directement à Flux grâce à un serveur dédié. Mais c’est plus cher et on n’a pas le choix d’autres intelligences… 🙂

Tarifs par type de moteur d’IA.

Tarifs par type de carte graphique utilisée (plus ou moins puissant, plus ou moins long).

L’avantage principal de cette méthode est qu’on peut travailler depuis son téléphone par exemple (en position couchée) avec un simple navigateur web, avant d’envoyer les calculs à faire à l’autre bout du monde, vers quelque monstre de puissance qui vous renvoie alors sur le téléphone le résultat de ses délibérations au bout de quelques secondes…

Voici mes premiers essais avec un prompt basique où il est question (on ne se refait pas) d’un plongeur dans un cénote mexicain. Avec, pour les deux dernières, l’ajout dans le prompt de la couleur rouge et orange : c’est un bain de sang ! 🙂

Quelques pas vers le réalisme…

Il n’y a pas que l’eau dans la vie…

Et pour finir, un peu d’onirisme avec ces salles de bains avec vue sur la mer… Faites de beaux rêves !

 

Publié le Août 21, 2024

Voir le site pro ?

Tous les tableaux

Tous les articles

0 commentaires