StableVicuna: il nuovo chatbot open source di Stability AI addestrato con l’apprendimento per rinforzo tramite feedback umano

Stability AI presenta StableVicuna, il primo chatbot open source del mondo dell’intelligenza artificiale ad utilizzare l’apprendimento per rinforzo tramite feedback umano (RLHF) insieme al fine-tuning di istruzioni.

La società ha utilizzato il modello Vicuna come base, applicando una fase di fine-tuning supervisionato (SFT) a tre dataset: OpenAssistant Conversations Dataset (OASST1), GPT4All Prompt Generations e Alpaca.

In seguito, è stato applicato l’apprendimento per rinforzo tramite feedback umano utilizzando i dataset di preferenze RLHF OpenAssistant Conversations Dataset (OASST1), Anthropic HH-RLHF e Stanford Human Preferences (SHP), mediante l’algoritmo Proximal Policy Optimization (PPO) con l’utilizzo del framework trlX.

Il risultato è StableVicuna, una versione ulteriormente affinata di Vicuna v0 13b, disponibile come peso delta del modello LLaMA 13b sul sito HuggingFace Hub.

La società ha anche presentato l’interfaccia del chatbot, in via di sviluppo, insieme a benchmark di performance che dimostrano la superiorità di StableVicuna rispetto ad altri chatbot open source di dimensioni simili.

La società invita gli utenti a provare StableVicuna e a fornire feedback per migliorare l’esperienza dell’utente.

NEWS AIopenmind su:

3D (4)6G (1)Adobe (9)Aeronautica (7)Africa (2)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (1)Amazon (6)Ambiente (1)Android (1)Animali (6)Animazione (2)Anziani (1)App (1)Apple (14)Archeologia (2)Architettura (3)Armi (2)Arredamento interni (1)Arte (21)Astronomia (2)Audio (21)Autoapprendimento (1)Avatar (2)Aviazione (1)Avvocati (1)Aziende (8)Banca (2)Bard (3)Biblioteca (1)Bill Gates (1)Bing (9)Birra (1)Blockchain (1)Boston Dynamics (1)Calcio (2)Canva (1)Cattolicesimo (3)Certificazioni (1)chataudio (1)Chatbot IA (25)Chip (2)Cina (47)Cinema (2)Clima (2)CNR (1)Coca-Cola (1)Commercio (1)Commissione Europea (1)Compagnie aeree (1)Computer quantistici (24)Computer Vision (3)Comuni italiani (1)Comunicazione (6)Comunicazioni vocali (1)Contabilità (1)Convegno (1)Copyright (4)Cybersecurity (1)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (1)Doppiaggio (1)Drone (1)Droni (1)E-commerce (1)Editing fotografico (2)Editoria (6)ENEA (1)Esercito (2)Etica (93)Europol (1)Eventi (3)Evento (3)Facebook (3)FakeNews (14)Falegnameria (1)Fauna selvatica (1)Finanza (5)Finanziamenti Italia (1)Firefly (2)Formazione (2)Fotografia (46)Francia (1)Free lance (1)Gaming (1)Garante privacy (11)Giappone (8)Giochi (3)Giornalismo (10)Giustizia (1)Google (92)Governo (5)Grafica (1)Guerra (8)Guida autonoma (2)Hong Kong (1)IBM (5)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Influencer (1)Informazione (2)Inghilterra (1)INPS (1)Intel (2)Istruzione (12)Lavoro (34)Libri (2)Linguistica computazionale (6)Linkedin (2)Maltrattamento infantile (1)Marina (1)Marketing (13)Medicina (19)Meta (16)Metaverso (14)Microsoft (57)Midjourney (10)Mobilità sostenibile (1)Moda (5)Mozilla (2)Musica (13)Nato (1)Natural Language Processing (1)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (11)Occhiali (1)Oculistica (1)OMS (1)OpenAI (96)Opera (2)Orologio (1)Parlamento Europeo (2)Patente di guida (1)Pensieri (1)Pianeta (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (15)Programmazione (3)Prompt (5)Pubblicazione (1)Pubblicità (10)Realtà mista (2)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (33)Ricerca scientifica (5)Riconoscimento emotivo (1)Risorse online (85)Ristorazione (2)Robotica (21)Salute (1)Samsung (1)Sanità (12)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)SEO (1)Shopping online (1)Sicurezza (14)Sicurezza informatica (20)SMS (1)Snapchat (2)Soccorso (1)Società (1)Software (3)Sport (1)Stable Animation SDK (1)Stable Diffusion (5)Standard (1)Startup (6)streaming live (1)Superintelligenza (1)Sviluppatori (1)Sviluppo sostenibile (1)Taiwan (2)Taxi (1)Telecomunicazioni (2)Telegram (1)Televisione (1)Tesla (3)TikTok (2)Torah (1)Traduttore AI (1)Truffa (1)Twitter (6)Ucraina (1)Udito (1)UE (6)UNESCO (1)Unione Europea (8)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Antiriciclaggio per l’arte: a Roma il Workshop

organizzato da Genio Business https://www.youtube.com/watch?v=BCd6l-uDkYc Questo imprescindibile aspetto per il mercato dell’Arte, alla luce delle trasformazioni e delle possibilità tecnologiche e di Intelligenza Artificiale dell’attuale momento...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines