F-VLM: L’innovazione nella raccolta dati per l’individuazione di oggetti

Presentato al convegno ICLR 2023, “F-VLM: Open-vocabulary object detection upon frozen vision and language models” introduce un approccio semplice e scalabile per l’individuazione di oggetti a vocabolario aperto.

La raccolta di dati attraverso l’annotazione manuale di maschere di istanze o bounding box è costosa e limita il vocabolario moderno a circa 1000 classi di oggetti, rendendo difficile la descrizione del mondo visivo.

Tuttavia, recenti modelli di visione e linguaggio (VLM) come CLIP, hanno dimostrato la capacità di riconoscimento visivo aperto migliore grazie all’apprendimento da coppie immagine-testo di scala Internet.

Gli F-VLM usano la stessa tecnica, senza richiedere la messa a punto o la formazione di VLM per compiti di rilevamento a vocabolario aperto.

Si è scoperto che le caratteristiche di un VLM congelato contengono informazioni ricche e sensibili alla regione per descrivere le forme degli oggetti e discriminative per la classificazione regionale, motivando l’uso di F-VLM per l’individuazione di oggetti a vocabolario aperto. I F-VLM mantengono la conoscenza dei VLM preaddestrati, riducendo la complessità di addestramento, mantenendo la filosofia di ViTDet e separando l’apprendimento specifico del rilevatore dalla conoscenza di visione più generale nel backbone del rilevatore.

NEWS AIopenmind su:

3D (4)6G (1)Adobe (9)Aeronautica (7)Africa (2)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (1)Amazon (6)Ambiente (1)Android (1)Animali (6)Animazione (2)Anziani (1)App (1)Apple (14)Archeologia (2)Architettura (3)Armi (2)Arredamento interni (1)Arte (21)Astronomia (2)Audio (21)Autoapprendimento (1)Avatar (2)Aviazione (1)Avvocati (1)Aziende (8)Banca (2)Bard (3)Biblioteca (1)Bill Gates (1)Bing (9)Birra (1)Blockchain (1)Boston Dynamics (1)Calcio (2)Canva (1)Cattolicesimo (3)Certificazioni (1)chataudio (1)Chatbot IA (25)Chip (2)Cina (47)Cinema (2)Clima (2)CNR (1)Coca-Cola (1)Commercio (1)Commissione Europea (1)Compagnie aeree (1)Computer quantistici (24)Computer Vision (3)Comuni italiani (1)Comunicazione (6)Comunicazioni vocali (1)Contabilità (1)Convegno (1)Copyright (4)Cybersecurity (1)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (1)Doppiaggio (1)Drone (1)Droni (1)E-commerce (1)Editing fotografico (2)Editoria (6)ENEA (1)Esercito (2)Etica (93)Europol (1)Eventi (3)Evento (3)Facebook (3)FakeNews (14)Falegnameria (1)Fauna selvatica (1)Finanza (5)Finanziamenti Italia (1)Firefly (2)Formazione (2)Fotografia (46)Francia (1)Free lance (1)Gaming (1)Garante privacy (11)Giappone (8)Giochi (3)Giornalismo (10)Giustizia (1)Google (92)Governo (5)Grafica (1)Guerra (8)Guida autonoma (2)Hong Kong (1)IBM (5)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Influencer (1)Informazione (2)Inghilterra (1)INPS (1)Intel (2)Istruzione (12)Lavoro (34)Libri (2)Linguistica computazionale (6)Linkedin (2)Maltrattamento infantile (1)Marina (1)Marketing (13)Medicina (19)Meta (16)Metaverso (14)Microsoft (57)Midjourney (10)Mobilità sostenibile (1)Moda (5)Mozilla (2)Musica (13)Nato (1)Natural Language Processing (1)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (11)Occhiali (1)Oculistica (1)OMS (1)OpenAI (96)Opera (2)Orologio (1)Parlamento Europeo (2)Patente di guida (1)Pensieri (1)Pianeta (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (15)Programmazione (3)Prompt (5)Pubblicazione (1)Pubblicità (10)Realtà mista (2)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (33)Ricerca scientifica (5)Riconoscimento emotivo (1)Risorse online (85)Ristorazione (2)Robotica (21)Salute (1)Samsung (1)Sanità (12)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)SEO (1)Shopping online (1)Sicurezza (14)Sicurezza informatica (20)SMS (1)Snapchat (2)Soccorso (1)Società (1)Software (3)Sport (1)Stable Animation SDK (1)Stable Diffusion (5)Standard (1)Startup (6)streaming live (1)Superintelligenza (1)Sviluppatori (1)Sviluppo sostenibile (1)Taiwan (2)Taxi (1)Telecomunicazioni (2)Telegram (1)Televisione (1)Tesla (3)TikTok (2)Torah (1)Traduttore AI (1)Truffa (1)Twitter (6)Ucraina (1)Udito (1)UE (6)UNESCO (1)Unione Europea (8)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Antiriciclaggio per l’arte: a Roma il Workshop

organizzato da Genio Business https://www.youtube.com/watch?v=BCd6l-uDkYc Questo imprescindibile aspetto per il mercato dell’Arte, alla luce delle trasformazioni e delle possibilità tecnologiche e di Intelligenza Artificiale dell’attuale momento...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines