StableVicuna: il nuovo chatbot open source di Stability AI addestrato con l’apprendimento per rinforzo tramite feedback umano

Stability AI presenta StableVicuna, il primo chatbot open source del mondo dell’intelligenza artificiale ad utilizzare l’apprendimento per rinforzo tramite feedback umano (RLHF) insieme al fine-tuning di istruzioni.

La società ha utilizzato il modello Vicuna come base, applicando una fase di fine-tuning supervisionato (SFT) a tre dataset: OpenAssistant Conversations Dataset (OASST1), GPT4All Prompt Generations e Alpaca.

In seguito, è stato applicato l’apprendimento per rinforzo tramite feedback umano utilizzando i dataset di preferenze RLHF OpenAssistant Conversations Dataset (OASST1), Anthropic HH-RLHF e Stanford Human Preferences (SHP), mediante l’algoritmo Proximal Policy Optimization (PPO) con l’utilizzo del framework trlX.

Il risultato è StableVicuna, una versione ulteriormente affinata di Vicuna v0 13b, disponibile come peso delta del modello LLaMA 13b sul sito HuggingFace Hub.

La società ha anche presentato l’interfaccia del chatbot, in via di sviluppo, insieme a benchmark di performance che dimostrano la superiorità di StableVicuna rispetto ad altri chatbot open source di dimensioni simili.

La società invita gli utenti a provare StableVicuna e a fornire feedback per migliorare l’esperienza dell’utente.

NEWS AIopenmind su:

3D (4)6G (1)Accademia di Comunicazione (1)Acer (1)Adobe (21)Aeronautica (9)Africa (2)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (3)AGID (1)Amazon (17)Ambiente (1)Android (4)Animali (6)Animazione (3)Anziani (1)App (5)Apple (29)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (24)Assistente vocale (2)Astronomia (2)Asus (1)AT&T (1)Audio (29)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (11)Banca (3)Bard (3)Biblioteca (1)Bill Gates (1)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (1)Calcio (2)Canva (2)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (39)Chip (2)Cina (49)Cinema (3)Claude (5)Clima (2)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (1)Compagnie aeree (1)Computer quantistici (27)Computer Vision (3)Comuni italiani (1)Comunicazione (7)Comunicazioni vocali (2)Concorso bellezza AI (1)Contabilità (1)Convegno (10)Copilot (5)Copyright (5)Criptovalute (1)Cybersecurity (1)Dalle-2 (2)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)Editing fotografico (2)Editoria (7)ENEA (2)Esercito (2)Etica (110)Europol (1)Eventi (4)Evento (7)Facebook (3)FakeNews (16)Falegnameria (1)Fauna selvatica (1)Film (2)Finanza (6)Finanziamenti Italia (3)Firefly (3)Formazione (7)Fotografia (74)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (16)Giappone (8)Giochi (5)Giornalismo (10)Giustizia (1)Google (161)Governo (7)Governo Italiano (1)Grafica (2)Guerra (10)Guida autonoma (3)Hong Kong (1)Hugging Face (2)IBM (6)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (2)Influencer (1)Informazione (6)Inghilterra (4)INPS (2)Intel (3)Istruzione (16)Jailbreaking (1)Lavoro (42)Libri (3)Linguistica computazionale (6)Linkedin (4)Maltrattamento infantile (1)Marina (1)Marketing (14)Medicina (23)Mercedes-Benz (1)Meta (39)Metaverso (15)Microsoft (108)Midjourney (11)Mobilità sostenibile (1)Moda (5)Modelli AI (1)Motori di Ricerca (2)Mozilla (2)Musica (24)Nato (1)Natura (1)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (23)Occhiali (2)Occhiali Intelligenti (1)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (132)Opera (3)Opera Browser (1)Oppo (2)Oracle (1)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Pianeta (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (17)Programmazione (7)Prompt (5)Pubblicazione (1)Pubblicità (15)QR Code (1)Qualcomm (2)Ray-Ban (2)Realtà mista (2)Reddit (1)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (57)Ricerca scientifica (7)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (2)Robotica (29)Salute (3)Samsung (4)Sanità (15)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Thorn e All Tech per Proteggere i Bambini Online

Aziende di spicco nel campo dell'intelligenza artificiale (IA) hanno dichiarato il loro impegno per prevenire la creazione e la diffusione di contenuti di abuso...

Falso Preside Utilizza AI per Diffondere Messaggi Razzisti

Un ex direttore atletico di un liceo a Baltimora è stato arrestato giovedì mattina per aver presumibilmente utilizzato l'intelligenza artificiale (IA) per simulare la...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines