Google говори за значението на отворения код и отворените данни в скорошна публикация в блога

Тех / Google говори за значението на отворения код и отворените данни в скорошна публикация в блога 3 минути четене

Google



Google като компания винаги е подкрепял софтуер и данни с отворен код, поне на тяхна позиция. Сега това е почти тенденция при големите компании, тъй като както Google, така и Microsoft направиха значителен принос към сцената с отворен код. „ Google също допринася значително за софтуера с отворен код. Основните примери за това включват Android , нашата операционна система за смартфони, Хром , кодовата база за нашия браузър Chrome (сега също захранване на много конкуренти ), и TensorFlow , нашата система за машинно обучение. Пускането от Google на Управители промени облачния хостинг завинаги и даде възможност за иновации и конкуренция в облачната индустрия. Google е и най-големият приносител на код с отворен код GitHub , споделено хранилище за разработване на софтуер. През 2017 г. служителите на Google направиха повече от 250 000 промени в десетки хиляди проекти само в GitHub. '

В повечето случаи всъщност не става дума за щедрост, а повече за това да се възползвате от свободното развитие и след това да спечелите от широкото осиновяване. Независимо от това, тези приноси са помогнали на хиляди изследователи и са ръководили разработването на софтуер по еднакъв начин, което трябва да бъде отпразнувано. Google в неотдавнашен пост в блога подчерта техния принос към отворените данни и софтуера с отворен код.



С появата на проследяването в реално време и разработването на автомобили без шофьор се правят много изследвания в областта на компютърното зрение и Google е една от компаниите в челните редици на Visual Tech.



Нашият ангажимент за отворен код и отворени данни ни накара да споделяме набори от данни, услуги и софтуер с всички. Например Google пусна Отворете набора от изображения от 36,5 милиона изображения, съдържащи близо 20 000 категории обекти с етикет на човека. С тези данни изследователите на компютърното зрение могат да обучават системи за разпознаване на изображения. По същия начин милионите анотирани видеоклипове в YouTube-8M колекцията може да се използва за обучение на разпознаване на видео.



- Вариантно нещо

Главен икономист, Google

Google също използва много данни, които могат да помогнат на NLP изследванията и да помогнат на компютрите да разберат по-добре човешката реч. В публикацията в блога Google подчерта споделянето на ключова база данни, заявявайки „ По отношение на обработката на езика, ние споделихме Естествени въпроси база данни, която съдържа 307 373 генерирани от човека въпроси и отговори. Също така предоставихме Корпус от трилион думи , който се основава на думи, използвани на публични уеб страници, и Ngram Viewer , който може да се използва за изследване на над 25 милиона книги в Google Книги . Тези колекции могат да се използват за статистически машинен превод , гласово разпознаване, корекция на правописа , откриване на субекти, извличане на информация и други езикови изследвания. '



Търсачката е един от основните бизнеси на Google, като всяка секунда получава над 63 000 заявки. Тези данни са много важни за компанията и Google ги анализира за целенасочена реклама. Все пак някои погледи за общите данни са публично достояние в портала за тенденции на Google.

' Google също предлага Google Тенденции , безплатна услуга, която позволява на всеки да вижда и изтегля обобщена активност от 2004 г. насам за Google Търсене, Търсене на изображения, Търсене на новини, Пазаруване и YouTube. Можете да получите информация за търсене за държави, региони, метро райони и градове на месечна, седмична, дневна и дори почасова база. Данните за тенденциите се използват широко от изследователите в области, различни като медицината и икономиката. Според Google Scholar има повече от 21 000 научни статии които цитират Trends като източник на данни. '

Защо да работите върху проекти с отворен код?

За това говорих накратко в началото на статията. Нов софтуер може да реализира чудесна идея и да внесе новаторство в пространството, но това не пречи на другите да прилагат подобни идеи и след това да работят за подобряването му. Много компании са го научили по трудния начин, например Windows Phone. Както знаем, това беше огромен провал и по много причини, но наличието на затворена среда и контрол на лицензирането беше голяма част от него. Hardoop и HDFS бяха версии с отворен код на MapReduce, създадени от Google и компанията научи значението на отворения код рано. Обобщавайки, решението да се направи IP с отворен код е стратегическо.

Google в публикацията си в блога се задълбочава в няколко други причини, заявявайки „ На първо място, нашата основна мисия е „да организираме световната информация и да я направим универсално достъпна и полезна“. Със сигурност един очевиден начин да направите информацията универсално достъпна и полезна е да я раздадете ! '

Те също така говорят за това защо не могат да пуснат някои неща, заявявайки „ Разбира се, не можем да предоставим всички данни, които използваме в нашия бизнес. Трябва да защитим поверителността на потребителите, да запазим поверителност за бизнес клиентите и да защитим собствената интелектуална собственост на Google. Но при такива съображения обикновено се опитваме да направим данните си възможно най-„универсално достъпни и полезни“. '

Етикети google