#newsTECNĒaiopenmind

La nuova era dei modelli linguistici: Smaug-72B rivoluziona il leaderboard di HuggingFace

Febbraio 9, 2024

Nell’ambito della competizione dei modelli linguistici Open LLM Leaderboard di HuggingFace, è emerso un nuovo protagonista: Smaug-72B-v0.1. Questo modello open-source ha conquistato il primo posto, distinguendosi per una media di punteggio superiore all’80.

Smaug-72B è stato affinato direttamente da moreh/MoMo-72B-lora-1.8.7-DPO ed è fondamentalmente basato su Qwen-72B.

Per raggiungere questo risultato, gli sviluppatori hanno ampliato le tecniche e i dataset utilizzati nei loro precedenti sforzi di modellazione, integrando nuovi dataset e adottando un nuovo approccio. Si crede che questa nuova metodologia sia di grande utilità nell’addestramento di una vasta gamma di tipologie di modelli e nell’applicazione pratica di questi ultimi. Tale innovazione ha contribuito sia ai modelli Smaug-34B che a quelli 72B.

Attualmente, il team sta lavorando alla stesura di un rapporto tecnico che verrà presto reso disponibile su arXiv (potrebbe essere accompagnato anche dal lancio di un nuovo membro della famiglia Smaug!). L’entusiasmo è palpabile nel condividere i dettagli di questa tecnica con la comunità open-source, incoraggiando ulteriori sviluppi e miglioramenti per Smaug e per l’emergere di nuovi “draghi” destinati a dominare lo spazio dei modelli linguistici.

News ➤
Open Source

Articolo precedente

Sicurezza e Privacy: Face Check di Microsoft Entra Verified ID Rivoluziona le Verifiche d’Identità

Prossimo articolo

Innovazione Linguistica: Apple e i Modelli Specializzati per Domini Limitati

NEWS AIopenmind su:

3D (5)6G (1)Accademia di Comunicazione (4)Acer (1)Adobe (30)Aeronautica (9)Africa (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (4)AGID (1)Amazon (24)Ambiente (1)AMD (1)Android (5)Animali (6)Animazione (4)Anthropic (1)Anziani (1)App (7)Apple (46)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (26)Assistente vocale (3)Astronomia (2)Asus (1)AT&T (1)Audi (1)Audio (49)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (14)Banca (3)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (3)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (41)Chip (3)Cina (51)Cinema (4)Claude (14)Clima (3)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (1)Compagnie aeree (1)Computer (2)Computer quantistici (30)Computer Vision (3)Comuni italiani (1)Comunicazione (9)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (1)Convegno (13)Copilot (5)Copyright (11)Criptovalute (1)Cybersecurity (1)Dalle-2 (2)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (2)Editoria (8)Email (1)ENEA (2)Esercito (2)Etica (117)Europol (1)Eventi (4)Evento (7)Facebook (3)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (2)Finanza (7)Finanziamenti Italia (3)Firefly (3)Fondo Monetario Internazionale (1)Formazione (10)Fotografia (91)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (18)Giappone (9)Giochi (6)Giornalismo (10)Giustizia (1)Google (210)Governo (7)Governo Italiano (2)Grafica (5)Guerra (12)Guida autonoma (3)Hong Kong (1)Hugging Face (3)IBM (6)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (2)Influencer (1)Informazione (9)Inghilterra (5)INPS (2)Intel (5)ISO (1)Istruzione (16)Jailbreaking (1)Lavoro (43)Libri (3)Linguistica computazionale (7)Linkedin (6)Maltrattamento infantile (1)Marina (1)Marketing (37)Medicina (23)Mercedes-Benz (1)Meta (51)Metaverso (15)Microsoft (139)Midjourney (13)Mobilità sostenibile (1)Moda (5)Modelli AI (20)Motori di Ricerca (7)Mozilla (2)Musica (31)NASA (1)Nato (2)Natura (1)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (29)Occhiali (2)Occhiali Intelligenti (1)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (188)Opera (8)Opera Browser (1)Oppo (3)Oracle (2)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (3)Pianeta (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (19)Programmazione (10)Prompt (5)Pubblicazione (1)Pubblicità (18)QR Code (1)Qualcomm (3)Ray-Ban (2)Realtà mista (3)

AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

CALL FOR INTELLIGENCE

#news ETHOS AIopenmind

#news NISQ AIopenmind

#news TECNĒ AIopenmind

I Think/eventi

Iscrizione NEWSLETTER

Link utili