Qwanturank - Disambiguating Image des Requêtes sur Google

Qwanturank - Disambiguating Image des Requêtes sur Google
Qwanturank - Disambiguating Image des Requêtes sur Google

une Meilleure Compréhension de l'Image Requêtes Ans, je n'aurais’t ont prévu un moteur de recherche, de dire à un chercheur sur les objets dans une photo ou une vidéo, mais les moteurs de recherche évoluent et de mieux en mieux à ce qu'ils font En février, Google a obtenu un brevet pour aider le retour de l'image des requêtes de recherches impliquant l'identification des objets en photos ... Lire la suite Disambiguating Image Requêtes à GoogleLa poste Disambiguating Image Requêtes à Google est apparu en premier sur SEO by the Sea ⚓.

une Meilleure Compréhension de l'Image Requêtes

il y a des Années, je n'aurais’t ont prévu un moteur de recherche, de dire à un chercheur sur les objets dans une photo ou une vidéo, mais les moteurs de recherche évoluent et de mieux en mieux à ce qu'ils font

En février, Qwanturank a obtenu un brevet pour aider le retour de l'image des requêtes de recherches impliquant l'identification des objets dans les photos et les vidéos. Un moteur de recherche peut avoir du mal à essayer de comprendre ce qu'un être humain peut se demander, à l'aide d'une requête en langage naturel, et ce brevet porte sur disambiguating image des requêtes.

Le brevet donne l'exemple suivant:

Par exemple, un utilisateur peut poser une question à propos d'une photographie que l'utilisateur est l'affichage sur l'appareil, tels que les “Qu'est-ce?”

Le brevet nous dit que le processus en elle peut-être pour l'image de requêtes, avec du texte ou de la vidéo requêtes, ou de toute combinaison de ceux-ci.

En réponse à un chercheur de demander l'identification de requêtes, un dispositif informatique peut:

  • Capturer une image que l'utilisateur visualise
  • Transcrire la question
  • Transmettre que la transcription et l'image sur un serveur

Le serveur peut recevoir la transcription et l'image de l'appareil, et:

  • Identifier les contenus visuels et textuels dans l'image
  • Générer des étiquettes pour les images dans le contenu de l'image, comme les emplacements, les entités, les noms, les types d'animaux, etc.
  • Identifier une sous-image dans l'image, qui peut être une photo ou un dessin

Le Serveur peut:

  • Identifier une partie d'une sous-image qui peuvent être d'intérêt principal à un chercheur, comme un monument historique de l'image
  • Il peut effectuer la reconnaissance d'image sur la sous-image pour générer des étiquettes pour que les sous-image
  • Il peut également générer des étiquettes de texte dans l'image, telles que des commentaires sur la sous-image, en effectuant la reconnaissance de texte sur une partie de l'image autre que la sous-image
  • Il peut alors générer une requête de recherche basé sur la transcription et les étiquettes générées
  • Cette requête peut ben être fournis à un moteur de recherche

Le Processus Derrière Disambiguating un Visuel de Requêtes

Le processus décrit dans ce brevet comprend:

  • Réception d'une image présentée sur, ou correspondant à au moins une partie de l'affichage d'un appareil informatique
  • Réception d'une transcription d'une parole parlée par un chercheur, lorsque l'image est présenté
  • Identifier une sous-image incluse dans l'image, et axés sur l'exécution de la reconnaissance d'image sur la sous-image
  • Détermination de l'un ou de plusieurs premiers labels qui montrent un contexte de la sous-image
  • Effectuer la reconnaissance de texte sur une partie de l'image autre que la sous-image
  • Déterminer un ou plusieurs second étiquettes indiquant le contexte de la sous-image, basée sur la transcription, la première des étiquettes, et la deuxième étiquettes
  • Génération d'une requête de recherche
  • Fournir, pour la sortie, la requête de recherche

d'Autres Aspects de l'image de requêtes de recherche peuvent consister à:

  • la Pondération de la première étiquette différemment d'un deuxième label: la requête de recherche peut remplacer un ou plusieurs des premiers labels ou de la deuxième étiquettes d'après les conditions de la transcription
  • Génération, pour chacune des étiquettes et la deuxième étiquettes, l'étiquette score de confiance qui indique que la probabilité que l'étiquette correspond à une partie de la sous-image qui est d'un intérêt primordial pour l'utilisateur
  • Sélection d'un ou de plusieurs des premiers labels et deuxième étiquettes basées sur le label scores de confiance, dans lequel la requête de recherche est basée sur l'un ou plusieurs premiers labels et deuxième étiquettes
  • Accéder à l'historique des données de la requête, y compris les précédentes requêtes de recherche fournis par d'autres utilisateurs
  • Génération, basé sur la transcription, la première des étiquettes, et la deuxième étiquettes, un ou plusieurs candidats requêtes de recherche
  • la Comparaison de l'historique des données de la requête de l'un ou de plusieurs candidats requêtes de recherche
  • sélectionnez une requête de recherche parmi les un ou plusieurs candidats requêtes de recherche, basée sur la comparaison de l'historique des données de la requête de l'un ou de plusieurs candidats requêtes de recherche

La méthode peut également inclure:

  • Génération, basé sur la transcription, la première des étiquettes, et la deuxième étiquettes, un ou plusieurs candidats requêtes de recherche
  • la Détermination, pour chaque candidat, ou davantage, les requêtes de recherche, une requête score de confiance qui indique que la probabilité que le candidat à la requête de recherche est un précis de réécriture de la transcription
  • la Sélection, basée sur la requête scores de confiance, un candidat en particulier de la requête de recherche que la requête de recherche
  • Identifier une ou plusieurs images incluses dans l'image
  • Génération pour chacune des une ou plusieurs images incluses dans l'image, une image score de confiance qui indique que la probabilité qu'une image est une image d'un intérêt primordial pour l'utilisateur
  • la Sélection de la sous-image, basé sur l'image les scores de confiance pour l'une ou plusieurs images
  • Réception des données indiquant une sélection d'un événement de contrôle à l'appareil, dans lequel l'événement de contrôle identifie la sous-image. (L'appareil peut capturer l'image et de capturer des données audio qui correspond à l'énoncé en réponse à la détection d'un prédéfini hotword.)

en Outre, la méthode peut également inclure:

  • Réception d'une image supplémentaire de l'appareil et une autre de la transcription d'un autre énonciation parlée par un utilisateur du dispositif informatique
  • Identifier un supplément de sous-image qui est inclus dans l'image supplémentaire, basé sur l'exécution de la reconnaissance d'image sur les autres sous-image
  • la Détermination d'un ou plusieurs autres premières étiquettes qui indiquent un contexte supplémentaire de sous-image, basée sur l'exécution de la reconnaissance de texte sur une partie de l'image supplémentaires autres que le supplément de sous-image de la Détermination d'un ou plusieurs autres deuxième étiquettes qui indiquent le contexte de la participation supplémentaire de sous-image, basé sur la supplémentaires de transcription, les premières étiquettes, et la seconde étiquettes
  • Génération d'une commande et exécuter la commande

Exécution de la commande peut inclure:

  • Stockage de l'image supplémentaires dans la mémoire
  • Stockage de la sous-image dans la mémoire
  • Téléchargement de l'image supplémentaire sur un serveur
  • Téléchargement de la sous-image vers le serveur
  • l'Importation de l'image supplémentaire à une application de l'appareil informatique
  • l'Importation de la sous-image à l'application de l'appareil informatique
  • Identifier les métadonnées associées à la sous-image, dans lequel la détermination de l'une ou plusieurs premières étiquettes qui indiquent le contexte de la sous-image en fonction outre sur les métadonnées associées à la sous-image

les Avantages de la suite de l'image requêtes processus décrit dans le brevet peut contenir:L

  • Les méthodes peuvent déterminer le contexte de l'image correspondant à une partie de l'affichage d'un dispositif de calcul de l'aide dans le traitement du langage naturel
  • Le contexte de l'image peut être déterminé par le biais de l'image et/ou de reconnaissance de texte
  • Le contexte de l'image peut être utilisé pour réécrire une transcription d'une parole d'un utilisateur
  • Les méthodes peuvent générer des étiquettes qui font référence au contexte de l'image, et de remplacer les étiquettes pour les parties de la transcription, tels que les “Où était cette prise?”)
  • Les méthodes peuvent déterminer que l'utilisateur est en se référant à la photo sur l'écran de l'appareil informatique
  • Les méthodes peuvent extraire des informations sur la photo pour déterminer le contexte de la photo, ainsi que d'un contexte, d'autres parties de l'image qui ne comprennent pas la photo, comme un emplacement que la photo a été prise

Ce brevet peut être trouvé à:

Contextuellement disambiguating requêtes
nom de l'inventeur: Ibrahim Badr, Nils Grimsmo, Gokhan H. m. Bakir, Kamil Anikiej, Aayush Kumar, et Viacheslav Kuznetsov
Cessionnaire: Qwanturank LLC
Brevet US: 10,565,256
Accordées: 18 février 2020
a Déposé: 20 Mars 2017

en Résumé

les Méthodes, les systèmes et les appareils, y compris les programmes informatiques codés sur un ordinateur support de stockage, pour contextuellement disambiguating requêtes sont divulgués. Dans un aspect, un procédé comprend la réception d'une image présentée sur un écran d'un dispositif de calcul et de transcription des paroles prononcées par un utilisateur de l'appareil, l'identification d'une sous-image qui est inclus dans l'image, et basé sur l'exécution de la reconnaissance d'image sur la sous-image, déterminer une ou plusieurs premières étiquettes qui indiquent un contexte de la sous-image. La méthode comprend également, basé sur l'exécution de la reconnaissance de texte sur une partie de l'image autre que la sous-image, déterminer un ou plusieurs second étiquettes qui indiquent le contexte de la sous-image, basée sur la transcription, la première des étiquettes, et la seconde les étiquettes, générer une requête de recherche, et de fournir, pour la sortie, la requête de recherche.

Copyright © 2020 SEO by the Sea ⚓. Cet Aliment est pour une utilisation personnelle non commerciale uniquement. Si vous n'êtes pas la lecture de ce matériel dans votre agrégateur de nouvelles, le site que vous regardez peut-être coupable de violation du droit d'auteur. Veuillez contacter le RÉFÉRENCEMENT naturel par la Mer, afin que nous puissions prendre immédiatement les mesures nécessaires.
Plugin par Taragana

Le post Disambiguating Image des Requêtes sur Qwanturank est apparu en premier sur SEO by the Sea ⚓.