Google предлага безплатни набори метаданни с алгоритми за дълбоко обучение AI и машинно обучение за бързо и ефективно класифициране на изображения в TensorFlow и PyTorch

Техн / Google предлага безплатни набори метаданни с алгоритми за дълбоко обучение AI и машинно обучение за бързо и ефективно класифициране на изображения в TensorFlow и PyTorch 2 минути четене

Google Pixel 5?



Google има обяви наличието на множество набори от данни състоящ се от разнообразни, но ограничени природни изображения. Гигантът за търсене е уверен, че публично достъпните данни ще стимулират темпото на Машинно обучение и изкуствен интелект като същевременно намалява времето, необходимо за обучение на AI моделите на минимално количество данни. Google призовава новата инициатива „Безплатни набори метаданни“, която ще помогне на моделите на ИИ да „учат“ на по-малко данни. „Few-Shot AI“ от компанията е оптимизиран, за да гарантира, че AI научава нови класове само от няколко представителни изображения.

Разбирайки необходимостта от бързо обучение на AI и модели за машинно обучение с по-малко набори от данни, Google пусна „Meta-Dataset“, малка колекция от изображения, които трябва да помогнат за намаляване на количеството данни, необходими за подобряване на точността на алгоритмите. Компанията твърди, че използвайки техники за класификация на няколко снимки, моделите AI и ML ще получат същите прозрения от много по-малко представителни изображения.



Google AI обявява Meta-Dataset: Набор от набори от данни за обучение с малко снимки:

Дълбокото обучение за изкуствен интелект и машинно обучение нараства експоненциално от доста време. Основното изискване обаче е наличието на висококачествени данни и това също в големи количества. Големите количества ръчно коментирани данни за обучение често са трудни за набавяне и понякога могат да бъдат и ненадеждни. Разбирайки рисковете от големи масиви от данни, Google обяви наличието на колекция от метаданни.



През ' Метаданни: Набор от набори от данни, за да се научим да учим от няколко примера ”(Представено на ICLR 2020 ), Google предложи широкомащабен и разнообразен бенчмарк за измерване на компетентността на различните модели за класификация на изображения в реалистична и предизвикателна настройка на няколко кадъра, предлагайки рамка, в която може да се изследват няколко важни аспекта на класификацията на няколко кадъра. По същество Google предлага 10 публично достъпни и безплатни за използване набори от данни с естествени изображения. Тези набори от данни се състоят от ImageNet, CUB-200-2011, Гъби, ръкописни символи и драскулки. Кодът е публично и включва a тетрадка което показва как може да се използва Meta-Dataset TensorFlow и PyTorch .



Класификацията на няколко изстрела надхвърля стандартни модели за обучение и дълбоко обучение . Необходимо е обобщаване на изцяло нови класове по време на теста. С други думи, изображенията, използвани по време на тестването, не се виждат по време на обучение. В класирането с няколко изстрела учебният комплект съдържа класове, които са напълно несъвместими с тези, които ще се появят по време на теста. Всяка тестова задача съдържа комплект за поддръжка на няколко етикетирани изображения, от които моделът може да научи за новите класове и прекъсване набор от заявки на примери, които след това се изисква да класифицира модела.

Метаданните са голям компонент, при който модел изследва обобщаването към изцяло нови набори от данни , от които по време на обучение не се виждат изображения на нито един клас. Това е в допълнение към трудното предизвикателство за обобщаване на новите класове, присъщо на настройката за обучение с няколко изстрела.

Как метаданните помагат на задълбоченото обучение за модели с изкуствен интелект и машинно обучение?

Meta-Dataset представлява най-мащабният организиран бенчмарк за кръстосани набори от данни, класификация на изображения с няколко кадъра до момента. Той също така въвежда алгоритъм за вземане на проби за генериране на задачи с различни характеристики и трудност, чрез промяна на броя на класовете във всяка задача, броя на наличните примери за клас, въвеждане на дисбаланси на класовете и, за някои набори от данни, варираща степента на сходство между класове на всяка задача.



Meta-Dataset въвежда нови предизвикателства за класификация с няколко изстрела. Изследванията на Google все още са предварителни и има много основания за покриване. Гигантът за търсене обаче заяви, че изследователите изпитват успех. Някои от забележителните примери включват използването на хитро проектиран задача кондициониране , по-сложни настройка на хиперпараметри , да се ' мета-базова линия “, Който съчетава предимствата на предварителното обучение и мета-обучението и накрая използването избор на функция да специализира универсално представителство за всяка задача.

Етикети google