Wyższy standard skuteczności
Blog
Informacje z branży i życia firmy
Wybierz dziedzinę

Wyszukiwanie obrazem i głosem w Google: praca wre!

Opublikowano: 18-03-2013
Czas potrzebny do przeczytania: 2:00 min

Google i inne wyszukiwarki internetowe świetnie sobie radzą w przypadku wyszukiwań osób, które wiedzą dokładnie czego szukają. Jeśli szukamy samochodu konkretnej marki, to wyniki będą przedstawiały informacje o szukanym przez nas pojeździe. Natomiast ich piętą achillesową są wyszukiwania użytkowników nie znających konkretnego opisu, nazwy danego produktu, czy też w sytuacji wyszukiwań pojęć przybliżonych, które jednak nie zawierają tych samych wyrażeń.

 


Profesor Geoffrey Hinton jest specjalistą z Uniwersytetu Toronto, który prowadzi prace nad nauczeniem komputerów „myślenia po ludzku”. Obecnie programy komputerowe mają spore problemy z rozpoznawaniem sieci kontekstowych pojęć, produktów, czy choćby wynikających ze specyfiki danego języka. Dlatego też niemałą trudnością byłaby dla nich interpretacja przytaczanego przez prof. Hintona zdania: „Widziałem Wielki Kanion podczas lotu do Chicago”. Dla ludzi oczywistym jest, że to nie Kanion był w drodze do Chicago, natomiast maszyna napotyka tu pewne trudności i potrzebuje dodatkowych danych.


Badania uczonego z Uniwersytetu Toronto oraz jego dwóch podopiecznych, Alexa Krizhevsky’ego i Ilyi Sutskevera wywołały spore zainteresowanie ze strony Google. Jest to absolutnie zrozumiałe – w końcu podwyższanie jakości wyników wyszukiwania leży u podstaw działalności Google, a obecne metody ich poprawy nieuchronnie muszą napotkać nieprzekraczalną barierę. Nauczenie wyszukiwarki myślenia zbliżonego do ludzkiego byłoby całkowitą rewolucją.


Jeff Dean, pracownik giganta z Mountain View, widzi ogromny potencjał w badaniach profesora Hintona w przypadku coraz bardziej popularnych wyszukiwań opartych na dźwięku i obrazie. Jest to szczególnie użyteczna funkcja w przypadku użytkowników smartfonów i innych urządzeń przenośnych. Wystarczyłoby zrobić zdjęcie jakiegoś przedmiotu aby wyszukać informacje na jego temat w Internecie lub też wprowadzić zapytanie głosowe aby uzyskać natychmiastową odpowiedź. Istniejące formy tych rozwiązań wciąż jeszcze raczkują.


Obecnie wyszukiwanie głosowe, czy też z wykorzystaniem obrazów jest niezwykle skomplikowane i ograniczone choćby z uwagi na trudności w rozpoznaniu zawartości zdjęcia, czy też zrozumieniu mówionej treści. Co prawda badania nad rozpoznawaniem mowy ludzkiej prowadzone są od wielu lat ale jeszcze do niedawna ogromną przeszkodą były ograniczenia technologiczne (wymagana moc obliczeniowa i przestrzeń na przechowywanie ogromnych ilości danych). A przecież dopiero po prawidłowym rozpoznaniu treści można rozpocząć pracę nad rozpoznaniem ich kontekstu, czyli mówiąc prościej ich interpretacją.


Czy profesor Hinton nauczy wyszukiwarkę Google „myśleć po ludzku”? Na razie wydaje się to dosyć odległa perspektywa pachnąca trochę science-fiction i koncepcją SI (Sztucznej Inteligencji). Niewykluczone jednak, iż już w niedalekiej przyszłości pierwsze wersje tego rozwiązania lub jego alternatywy będziemy mogli przetestować na własnych komputerach lub urządzeniach przenośnych.

 

Źródło: The Globe and Mail

Autor
Krzysztof Mierzyński
Ocena artykułu
5.00 - (4 głosy)
Komentarze
Dodaj komentarz
Ostrzeżenie: Uwaga na firmę o podobnej nazwie! Więcej...
Zapoznałem się