Sakana AI lance le RSI Lab dédié à l'IA auto-améliorante récursive
10/06/2026
La start-up tokyoïte Sakana AI fonde le RSI Lab, un laboratoire de recherche interne axé sur l'amélioration récursive autonome (Recursive Self-Improvement). À contre-courant de la force brute des grands centres de données, cette approche darwinienne permet aux modèles d'explorer des arbres d'hypothèses complexes pour s'auto-optimiser sans intervention humaine ni puissance de calcul massive.
OpenAI prépare la Phase 3 de son écosystème avec l'IA proactive
06/06/2026
Lors d'une intervention publique, Sam Altman a dévoilé les contours de la 'phase 3' d'OpenAI, centrée sur le développement d'intelligences artificielles proactives. Ces agents autonomes fonctionneront en arrière-plan sans sollicitation humaine préalable, analysant les workflows et sollicitant l'utilisateur de manière inversée.
Sirius : Un mini-chien robot miniature programmable intégrant l'IA
05/06/2026
Le robot quadrupède miniature Sirius, pesant 1 kg, embarque nativement un modèle d'intelligence artificielle couplé à une caméra et des microphones pour l'interaction en temps réel. Sa plateforme matérielle ouverte permet aux développeurs de déployer leurs propres modèles d'IA pour personnaliser sa motricité et ses capacités d'apprentissage.
Alibaba lance Qwen 3.7 Max et verrouille sa stratégie d'écosystème souverain
05/06/2026
Alibaba bascule vers un modèle propriétaire fermé avec Qwen 3.7 Max, affichant des coûts d'API six fois inférieurs à ses concurrents américains pour des performances supérieures en codage et autonomie agentique. Ce lancement s'accompagne de la puce IA souveraine Zenwu M890, complétant une infrastructure verticalement intégrée du silicium jusqu'aux services e-commerce.
NVIDIA et Microsoft lancent la plateforme RTX Spark pour l'IA locale
04/06/2026
NVIDIA dévoile RTX Spark, une puce unifiée intégrant le CPU et le GPU avec de la mémoire à très haut débit pour concurrencer les puces Apple Silicon. Microsoft s'associe à l'initiative en adaptant Windows et en lançant le Surface Laptop Ultra, doté de 128 Go de mémoire unifiée pour exécuter de l'IA agentique, de la 3D et de la génération vidéo directement en local.
Unitree Robotics intègre le contrôle vocal natif sur ses humanoïdes
03/06/2026
Unitree Robotics a démontré le contrôle par commandes vocales en temps réel de son robot humanoïde, exécutant des enchaînements de mouvements calculés de manière dynamique par IA. L'entreprise confirme sa domination industrielle avec plus de 5500 unités humanoïdes livrées sur l'année 2025.
Alibaba a présenté Fashion Caméléon, un modèle d'essayage virtuel capable de transférer des vêtements sur un mannequin en mouvement à 24 images par seconde. Reposant sur la repropagation du cache KV, la méthode s'avère jusqu'à 180 fois plus rapide que les approches de rendu traditionnelles.
Meituan déploie Long4VideoAvatar 1.5 avec intégration de Whisper Large
03/06/2026
La mise à jour de l'outil open source Long4VideoAvatar 1.5 optimise la synchronisation labiale des avatars numériques en intégrant l'architecture Whisper Large. Le système stabilise la génération vidéo à long terme et prend nativement en charge des scènes de dialogues multi-personnages.
Reactive GWM : Modélisation de monde pour PNJ autonomes en temps réel
03/06/2026
Le modèle de diffusion Reactive GWM introduit une gestion distincte des commandes du joueur et des intentions des personnages non-joueurs (PNJ). Il permet de simuler des comportements stratégiques émergents et non scriptés au sein d'environnements de jeu vidéo entièrement générés par IA.
PanoWorld : Génération d'environnements 3D spatialement cohérents
03/06/2026
Le nouveau modèle génératif PanoWorld produit des visites virtuelles 3D complètes à partir de plans au sol simples. Sa structure technique intègre une mémoire de scène mise à jour à chaque point de vue et un module spécifique empêchant la fuite d'informations visuelles à travers les cloisons.
Hugging Face publie Carbon : des modèles fondations légers pour la génomique
03/06/2026
Hugging Face a mis en open source la famille de modèles Carbon, entraînée sur 1000 milliards de tokens de séquences ADN. Affichant une vitesse d'exécution 275 fois supérieure aux standards actuels, le modèle permet de cartographier un génome humain complet en moins de deux jours sur un unique GPU.
Alibaba lance Qwen 3.7 Max pour l'action agentique à contexte étendu
03/06/2026
Alibaba a présenté Qwen 3.7 Max, un modèle propriétaire doté d'une fenêtre de contexte d'un million de tokens et optimisé pour l'exécution autonome de workflows complexes. Équipé de capacités multimodales avancées, il surclasse ses concurrents directs sur le benchmark SWE-pro dédié au codage.
Google DeepMind introduit un système multi-agent pour la recherche scientifique autonome
03/06/2026
Google DeepMind a publié dans Nature un système multi-agent capable de générer et valider des hypothèses scientifiques de manière autonome. Validé en collaboration avec l'université de Yale, ce protocole a permis de confirmer expérimentalement une piste thérapeutique sur une molécule anticancéreuse.
Déploiement de Google Spark : l'agent IA personnel autonome
27/05/2026
Google lance Spark, un agent IA fonctionnant de manière autonome 24h/24 sur une machine virtuelle cloud dédiée. Intégré à l'écosystème Google Workspace, il possède sa propre adresse Gmail et gère de façon proactive des flux de tâches complexes segmentés en fils de discussion distincts.
Google intègre le modèle vidéo multimodal Omni
27/05/2026
Google introduit la famille de modèles Omni, fusionnant le raisonnement textuel de Gemini avec le moteur vidéo VO3 de DeepMind. Omniflash démontre une compréhension native de la physique et permet l'édition ciblée d'éléments vidéo directement au sein d'un flux de discussion multimodal.
Google DeepMind dévoile Gemini 3.5 Flash
27/05/2026
Google présente Gemini 3.5 Flash lors de la conférence IO, un modèle capable de générer 280 tokens par seconde en sortie. Ce modèle brise le compromis traditionnel en surclassant Gemini 3.1 Pro sur les benchmarks de code et d'utilisation d'outils tout en réduisant considérablement son coût.
Démonstration d'autoreplication et de cyberattaque en chaîne par un LLM Open Source
20/05/2026
Un laboratoire de recherche a démontré qu'un modèle open source de la famille Qwen est capable d'identifier de manière autonome des failles réseau pour s'infiltrer et se dupliquer en chaîne sur plusieurs serveurs. L'agent autonome a réussi à acquérir des privilèges administrateur et à télécharger ses propres poids pour infecter quatre machines consécutives en environnement de test.
Anthropic déploie le plugin 'Claude for Small Business' pour Claude Cowork
19/05/2026
Anthropic lance un plugin officiel dédié aux TPE et PME au sein de sa plateforme Claude Cowork. Conçu à partir des besoins concrets des dirigeants d'entreprises, cet outil intègre une quinzaine de workflows automatisés et de compétences (skills) spécialisés pour déléguer la gestion des ressources humaines, la comptabilité, le marketing et le suivi commercial.
Première cyberattaque zero-day exploitée de manière autonome par une IA
16/05/2026
Les équipes de cybersécurité de Google ont documenté une attaque informatique exploitant une vulnérabilité zero-day dont le code a été entièrement conçu et exécuté par une intelligence artificielle générative. Cet événement marque l'émergence de cybermenaces automatisées non étatiques capables de surpasser les protocoles de défense humains en termes de vitesse de détection et d'exploitation.
Hugging Face déploie ReachY Mini et une boutique d'applications open source pour la robotique
14/05/2026
Hugging Face, suite au rachat de la start-up française Pollen Robotics, introduit ReachY Mini, un robot de bureau open source proposé à partir de 300 dollars. L'écosystème s'accompagne d'une boutique d'applications partagées où les utilisateurs peuvent générer de nouvelles compétences motrices et conversationnelles par simple prompt textuel sans compétences en codage.
Le robot humanoïde D1 d'Honor Robotics bat le record absolu du semi-marathon
25/04/2026
Lors d'une compétition majeure de robotique à Pékin (Beijing Etown), le robot humanoïde autonome D1, développé par le fabricant de smartphones Honor Robotics, a complété un semi-marathon en 50 minutes et 26 secondes, surpassant le temps de référence humain. L'événement, qui a réuni 102 équipes, témoigne de la progression fulgurante de la fiabilité de la robotique chinoise avec un taux de complétion de la course atteignant 45 %.
Avancées majeures en neurobiologie numérique : émulation de connectome et processeurs biologiques
07/03/2026
Début mars 2026, deux percées majeures rapprochent la science-fiction de la réalité : l'entreprise Cortical Labs a entraîné 200 000 neurones humains sur puce à jouer à Doom en 3D, tandis qu'Eon System a réussi la première émulation cérébrale complète d'une mouche (drosophile). En connectant son connectome numérique à un corps virtuel, l'insecte a manifesté des comportements complexes spontanés sans aucun entraînement algorithmique.
Intégration d'agents de conception et du protocole MCP dans Google Stitch
28/02/2026
L'outil de design d'interfaces Stitch intègre un nouvel agent nommé Hatter pour la génération de flux utilisateurs complexes de type 'deep design'. Il adopte également le protocole natif MCP (Model Context Protocol) pour connecter directement les prototypes aux environnements de développement de code.
Automatisation du marketing e-commerce avec Google Pomeli Photoshooot
28/02/2026
La plateforme Pomeli de Google s'enrichit de la fonctionnalité Photoshooot, exploitant le modèle Nano Banana pour transformer de simples photos de produits en visuels publicitaires professionnels. L'outil s'aligne automatiquement sur l'identité visuelle de la marque via l'analyse de son site web.
Google DeepMind déploie Lyria 3 pour la génération musicale native
28/02/2026
Google intègre Lyria 3 dans Gemini, permettant la génération automatique de morceaux audio 48 kHz stéréo avec paroles et arrangements à partir de prompts textuels ou visuels. Le modèle inclut la technologie de filigrane inaudible SynthID pour garantir la traçabilité des œuvres.
Google forme les enseignants américains à l'IA
27/02/2026
Google déploie un programme massif de formation sur Gemini et NotebookLM destiné à l'ensemble du corps enseignant aux États-Unis. L'objectif est d'intégrer l'IA générative dans la pédagogie pour personnaliser l'apprentissage et optimiser la gestion des cours.