Ce sunt frazele statistic improbabile?

Statistically Improbable Phrases, sau SIP-uri, este o tehnologie de căutare dezvoltată de Amazon.com pentru a căuta în conținutul cărților fraze conținute în ele care sunt susceptibile să fie unice sau să apară des. Aceasta face parte din programul de tehnologie patentat Search Inside!® de la Amazon. În esență, Search Inside® oferă Amazon acces la textul parțial sau integral al unei cărți, astfel încât anumite expresii să poată fi folosite pentru a identifica cartea dacă sunt folosite expresii statistic improbabile într-o căutare.

Numele acestei tehnologii este puțin confuz. Când efectuați o căutare, doriți să se potrivească îndeaproape cu ceea ce căutați. Prin identificarea unei expresii unice într-o carte, dacă utilizați acea expresie pentru a căuta, este improbabil ca căutarea dvs. să afișeze ceva ce nu doriți. Dacă sunteți în căutarea unei anumite cărți și nu vă amintiți titlul, dar vă puteți aminti un citat din ea, puteți utiliza citatul pentru a căuta cartea.

Alternativ, ați putea dori să căutați un anumit subiect, într-un subiect mai amplu. De exemplu, dacă ați vrut să căutați o carte cu sfaturi în carieră, dar ceea ce vroiați cu adevărat să citiți despre cum să faceți rețea pentru locuri de muncă, ați putea căuta „rețea” în loc de „sfaturi în carieră”. Imediat, unele dintre cele mai relevante căutări apar pe pagina cu rezultatele căutării Amazon, inclusiv cărți precum Dig Your Well Before You’re Thirsty: singura carte de rețea de care veți avea nevoie vreodată.

Dacă ați căutat cu aceste tipuri de expresii improbabile din punct de vedere statistic, este posibil să observați că puteți obține rezultate care nu sunt tocmai potrivite. De exemplu, primul randament de căutare pentru rețele nu este pentru rețele de carieră, ci pentru informații de rețea de computere și tehnologie. Puteți face fraze mai bune improbabile din punct de vedere statistic, fiind mai precis. De exemplu, obțineți rezultate mai bune căutând în rețele de carieră sau rețele de locuri de muncă.

Expresiile improbabile din punct de vedere statistic sunt de fapt expresii probabile, deoarece este probabil ca o expresie unică a unei cărți Search Inside!® să fie în fruntea listei lucrurilor pe care le căutați. Ați putea, de exemplu, să introduceți un vers de Shakespeare dintr-un sonet Shakespeare pentru a aduce cărți despre Shakespeare. Acest lucru nu funcționează întotdeauna bine, deoarece unele citate foarte cunoscute sunt folosite în multe alte cărți ca titluri. Nu vei găsi Hamlet dacă cauți „A fi sau a nu fi”. Nici pe Macbeth nu-l vei găsi cu fraze improbabile din punct de vedere statistic precum „Out! La naiba loc.” De fapt, sub acest ultim termen, prima carte pe care o veți găsi este una despre îndepărtarea petelor.

Utilizarea expresiilor statistic improbabile este, de asemenea, o modalitate de a căuta conținut web, iar crawlerele web pot folosi o tehnologie similară, astfel încât oamenii să poată căuta în mod eficient și specific anumite linii unice. Nu este o tehnologie perfectă, deoarece un crawler web nu evaluează neapărat conținutul. Poate căuta repetarea cuvintelor cheie care permite oamenilor să găsească piese cu un număr mai mare de repetiții de cuvinte cheie. Nu toate cărțile de pe Amazon au tehnologia Search Inside!®, dar aceasta pare să fie tendința. În cele din urmă, chiar dacă sistemul este ușor imperfect, ar putea reduce timpul de căutare.