Vyhledávání pomocí významových vektorů

 

V pátek 29. ledna v Seznam.cz do přirozeného vyhledávání nasadili největší změnu v technologii za posledních 10 let. Nejedná se o nic menšího než hledání pomocí významových vektorů. Hledání webových stránek, které obsahují konkrétní slova, teď rozšířili o hledání stránek, které mají podobný význam jako dotaz i přesto, že v nich některé z požadovaných slov chybí.

Ke stávajícím výsledkům přidali vyhledávání pomocí významových vektorů. Z dotazů i webových stránek vyrábí sadu vektorů, které reprezentují, co daný kus textu znamená. Vektory počítají embeddingovým modelem, který je naučený přiřazovat podobné vektory textům, které se obvykle vyskytují v podobných kontextech. K vektorům dotazu pak hledají nejpodobnější vektory stránek v mnohorozměrném vektorovém prostoru.

Podobnost významových vektorů je současně důležitým signálem pro řazení výsledků. Vedle nalezení nových stránek tak dojde i ke změnám pozic těch stávajících. Není to poslední změna v řazení pro nejbližší dobu. Tím, že nasazují novou technologii, se otevřel prostor pro další rozvoj a chystají další vylepšování.

Kompletní informace si můžete přečíst přímo na Seznam.cz