"Respect"
Par Christophe, vendredi 4 août 2006 à 17:14 :: Informatique :: #80 :: rss
< kik> n'empeche, google reste un mystere pour moi
< kik> comment il font pour répondre aussi vite a autant de requetes sur des bdd si vastes?
< christophe971> :)
< christophe971> j'en parlais hier avec mon frêre :p
< simonpca> kik: ils ont des systèmes rapides :)
< simonpca> [explication vague inside]
< christophe971> un mot :
< christophe971> "précalcul"
< simonpca> "budget monstre"
< christophe971> si tu regardes bien, tu vois que page suivante après page suivante
< kik> simonpca: merci pour cette réponse salvatrice :)
< christophe971> le nombre de résultats estimés à la requete varie
< christophe971> ça prouve qu'ils précalculent les trois premières pages environ
< christophe971> pour des millions de requetes
< kik> hum
< christophe971> et qu'ils font ressortir la cache à chaque fois
< christophe971> en fait
< christophe971> ça cherche pas
< simonpca> et qu'ils modifient ce cache lors des "google dance"
< simonpca> ahhhh...
< christophe971> ça regarde une correspondance
< christophe971> et ça prends
< christophe971> simonpca: entre autre
< simonpca> wow
* simonpca a l'impression de comprendre un truc vachement compliqué là
< kik> dans y a des pages préselectionnées pour chaque keyword, et ca recoupe après?
< christophe971> mieux
< christophe971> des pages préselectionnées pour chaque millions de requetes
< christophe971> avec un ou plusieurs keywords
< christophe971> genre
< christophe971> tu pompes 1000 pages
< kik> en gros, si t'es les premier a rentrer un requete, ca peut prendre du temps, sinon c'est instantané?
< christophe971> tu prends les mots-clés
< christophe971> les associations de mots-clés
< christophe971> et tu sors ce qui corresponds
< christophe971> mmm
< christophe971> jamais vu ça
< christophe971> ça prends toujours moins d'une seconde
< christophe971> je pense qu'ils calculent selon tous les mots-clés
< christophe971> ce qui expliquent pourquoi ils ne prennent pas en compte les trucs genre
< christophe971> "à" "de" et autre
< kik> hum
< christophe971> ça veut rien dire
< kik> (c'est quand meme un truc de fou)
< christophe971> et ça prends du process
< christophe971> "Pour limiter les résultats aux pages les plus pertinentes (total : 907), Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
< christophe971> après 31 pages sur le mot "love"
< christophe971> 30*30=900
< christophe971> ALORS QUE
< christophe971> Résultats 901 - 907 sur un total d'environ 1 710 000 000 pour love. (0,46 secondes)
< christophe971> donc ya bien plus de résultats
< simonpca> christophe971: tu sais quoi, tu devrais écrire un bouquin là dessus
< christophe971> et je parie
< simonpca> sérieux
< simonpca> :)
< christophe971> que si je clique sur "les liens similaires"
< christophe971> ben les requetes seront bien plus longues
< kik> hum
< christophe971> même pas
< christophe971> Résultats 961 - 990 sur un total d'environ 1 240 000 000 pour love. (0,48 secondes)
< christophe971> après avoir cliqué sur le lien
< christophe971> donc
< christophe971> je viens de découvrir l'arnaque google
< christophe971> la grande arnaque
< christophe971> pour chaque mot-clé
< christophe971> ils ne donnent pas plus de 2000 résultats
< christophe971> même s'il y a un milliard de pages qui ont ce mot clé
< kik> donc en gros, y a des machines chez google qui passe leur temps a simuler des requetes pour que les machines responsable de l'interface utilisateur répondent instantanément?
< christophe971> oui
< kik> respect
< simonpca> respect too
( irc.freenode.net #kolibria )

Commentaires
1. Le samedi 5 août 2006 à 23:50, par vdemeester
2. Le dimanche 6 août 2006 à 23:46, par geoffrey
3. Le lundi 7 août 2006 à 00:28, par Christophe
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.