Zaawansowane wyszukiwanie i język zapytań. Język wyszukiwarki

Komputery

Język zapytań jest sztucznie stworzonym językiem programowania używanym do tworzenia zapytań w bazach danych i systemach informatycznych.

język zapytań

Ogólnie rzecz biorąc, takimi metodami zapytania może byćklasyfikować, w zależności od tego, czy służą do bazy danych, czy do wyszukiwania informacji. Różnica polega na tym, że wnioski o takie usługi są podejmowane w celu uzyskania rzeczywistych odpowiedzi na postawione pytania, podczas gdy wyszukiwarka próbuje znaleźć dokumenty zawierające informacje dotyczące regionu zainteresowania użytkownika.

Bazy danych

Języki zapytań dla baz danych zawierają następujące przykłady:

  • QL - obiektowe, odnosi się do relacyjnych baz danych; następca Datalogu.
  • Kontekstowy (CQL) to formalny język reprezentacji zapytań dla systemów wyszukiwania informacji (takich jak indeksy stron internetowych lub katalogi bibliograficzne).
  • CQLF (CODYASYL) - dla baz danych CODASYL-TYPE.
  • Język zapytań zorientowanych na koncepcje (COQL) -jest używany w odpowiednich modelach (com). Opiera się na zasadach konstruowania modeli danych i wykorzystuje takie operacje jak projekcja i de-projekcja analizy wielowymiarowej, operacje analityczne i wnioski.
  • DMX - używany do modeli wyszukiwania danych.
  • Datalog to język zapytań do dedukcyjnych baz danych.
  • Gellish English to język, który możeUżywany do zapytań w angielskich bazach Gellish i umożliwia prowadzenie dialogów (zapytań i odpowiedzi), a także służy do modelowania informacji wiedzy.
  • HTSQL - tłumaczy żądania HTTP na SQL.
  • ISBL - używany do PRTV (jeden z pierwszych systemów zarządzania relacyjnymi bazami danych).
  • LDAP to protokół dla zapytań i usług katalogowych działających za pośrednictwem protokołu TCP / IP.
  • MDX jest wymagany w przypadku baz danych OLAP.

Język zapytań Yandex

Wyszukiwarki

Język zapytań z koleima na celu wyszukiwanie danych w wyszukiwarkach. Różni się tym, że często żądania zawierają zwykły tekst lub hipertekst z dodatkową składnią (na przykład "i" / "lub"). Różni się znacznie od standardowych języków podobnych, które są regulowane przez ścisłe reguły składni komend lub zawierają parametry pozycyjne.

W jaki sposób są klasyfikowane zapytania?

Istnieją trzy szerokie kategorie, któreobejmują większość zapytań: informacyjnych, nawigacyjnych i transakcyjnych. Chociaż ta klasyfikacja nie została ustalona teoretycznie, została empirycznie potwierdzona obecnością rzeczywistych zapytań w wyszukiwarkach.

Żądania informacji to takie, któreobejmują szerokie tematy (na przykład konkretny model miasta lub ciężarówki), dla których można uzyskać tysiące istotnych wyników.

Nawigacja to wyszukiwanie, które wyszukuje jedną witrynę lub stronę internetową na określony temat (na przykład YouTube).

wyszukaj język

Transakcyjne - odzwierciedlają intencję użytkownika, aby wykonać określone działanie, na przykład, aby kupić samochód lub zarezerwować bilet.

Wyszukiwarki często obsługują czwartątyp żądania, który jest używany znacznie rzadziej. Są to tak zwane żądania połączeń, które zawierają raport dotyczący połączenia zindeksowanej grafiki internetowej (liczba linków do określonego adresu URL lub liczba stron indeksowanych z określonej domeny).

Jak wygląda wyszukiwanie informacji?

Większość wyszukiwarek nie ujawnia ichdzienniki wyszukiwania, więc informacje, których użytkownicy szukają w Internecie, są bardzo trudne do znalezienia. Niemniej jednak pierwsze badania naukowe pojawiły się w 1998 roku. Później, w 2001 r. Przeprowadzono drugie badanie, w którym przeanalizowano zapytania, które były wyświetlane jako bardzo istotne. Stało się również jasne, w jaki sposób język zapytań jest używany przez wyszukiwarki.

Interesujące funkcje związane z wyszukiwaniem w Internecie stały się znane:

Średnia długość zapytania wyszukiwania wynosiła 2,4 słowa.

  • Około połowa użytkowników wysłała jedno żądanie, a nieco mniej niż jedna trzecia użytkowników przesłała co najmniej trzy unikatowe żądania jeden po drugim.
  • Prawie połowa użytkowników oglądała tylko pierwszą lub dwie strony wyników.
  • Mniej niż 5% użytkowników korzysta z zaawansowanych funkcji wyszukiwania (na przykład wybierając określone kategorie lub szukając w wyszukiwaniu).

Niestandardowe funkcje akcji

Badanie wykazało również, że 19% wnioskówzawierał określenie geograficzne (na przykład nazwy, kody pocztowe, obiekty geograficzne itp.). Warto również zauważyć, że oprócz krótkich zapytań (czyli z kilkoma warunkami), były często przewidywalne wzorce, w których użytkownicy zmienili swoje wyszukiwane słowa.

logiczny język zapytań

Stwierdzono również, że 33% wniosków odjeden użytkownik powtarza się, a w 87% przypadków użytkownik kliknie ten sam wynik. Sugeruje to, że wielu użytkowników używa powtarzających się żądań do przeglądania lub ponownego wyszukiwania informacji.

Kwerendy dystrybucji częstotliwości

Ponadto eksperci to potwierdziliRozkłady częstotliwości żądań odpowiadają prawu energetycznemu. Oznacza to, że niewielka część słów kluczowych jest obserwowana na największej liście żądań (na przykład ponad 100 milionów) i są one najczęściej używane. Pozostałe zdania w ramach tych samych tematów są używane rzadziej i bardziej indywidualnie. Zjawisko to nazywane jest zasadą Pareto (lub "reguła 80-20") i umożliwiało wyszukiwarkom korzystanie z technik optymalizacyjnych, takich jak indeksowanie lub dzielenie bazy danych, buforowanie i wstępne pobieranie, a także umożliwiało ulepszanie języka zapytań.

W ostatnich latach stwierdzono, że średnia długośćliczba zapytań stale rośnie w miarę upływu czasu. Tym samym średnie zapytanie w języku angielskim stało się dłuższe. W związku z tym firma Google wprowadziła aktualizację pod nazwą "Hummingbird" (sierpień 2013 r.), Która jest w stanie obsłużyć długie wyszukiwane słowa z nie-protokołem, "mówionym" językiem zapytań (np. "Gdzie jest najbliższa kawiarnia?").

wniosek w języku angielskim

W przypadku dłuższych żądań stosuje się ich przetwarzanie - są one podzielone na wyrażenia sformułowane standardowym językiem, a odpowiedzi na różne części są wyświetlane oddzielnie.

Zapytania strukturalne

Wyszukiwarki, które wspierają logikęoperacje i składnia używają bardziej zaawansowanych języków zapytań. Użytkownik, który wyszukuje dokumenty obejmujące kilka tematów lub twarzy, może opisać każde z nich zgodnie z logiczną charakterystyką danego słowa. Zasadniczo logiczny język zapytań jest zbiorem niektórych fraz i znaków interpunkcyjnych.

Co to jest wyszukiwanie zaawansowane?

Język zapytań "Yandex" i "Google" jest w stanieprzeprowadzić bardziej ukierunkowane wyszukiwanie pod pewnymi warunkami. Wyszukiwanie zaawansowane może wyszukiwać według części nazwy strony lub prefiksu tytułu, a także w niektórych kategoriach i listach nazw. Może również ograniczyć wyszukiwanie stron, które zawierają określone słowa w tytule lub znajdują się w określonych grupach tematycznych. Przy odpowiednim użyciu języka zapytań może on przetwarzać parametry o rząd wielkości bardziej złożone niż wyniki powierzchniowe większości wyszukiwarek, w tym za pomocą słów zdefiniowanych przez użytkownika ze zmiennym zakończeniem i podobną pisownią. Podczas prezentacji wyników wyszukiwania zaawansowanego zostanie wyświetlony link do odpowiednich sekcji strony.

język zapytań wyszukiwania

To także możliwość przeszukiwania wszystkich stron,zawierające konkretną frazę, a przy standardowym zapytaniu, wyszukiwarki nie mogą zatrzymać się na żadnej stronie dyskusji. W wielu przypadkach język zapytania może prowadzić do dowolnej strony znajdującej się w tagach noindex.

W niektórych przypadkach dobrze sformułowane zapytanie pozwala znaleźć informacje zawierające wiele znaków specjalnych i liter innych alfabetów (np. Chińskie znaki).

W jaki sposób są znaki w języku zapytań?

Duże i małe litery oraz niektóreznaki diakrytyczne (umlauty i akcenty) nie są liczone w wyszukiwaniach. Na przykład wyszukiwanie według słowa kluczowego Citroen nie znajdzie stron zawierających słowo Citroen. Ale niektóre ligatury odpowiadają poszczególnym literom. Na przykład po wyszukaniu słowa "aeroscobing" łatwo znajdziesz strony zawierające "Ereskebing" (AE = Æ).

Wiele znaków niealfanumerycznych jest ciągleignorowane. Na przykład niemożliwe jest znalezienie informacji na temat zapytania zawierającego ciąg | L | (litera między dwoma pionowymi kreskami), pomimo faktu, że ten symbol jest używany w niektórych szablonach konwersji. W wynikach będą tylko dane z "LT". Niektóre znaki i wyrażenia są przetwarzane inaczej: żądanie "kredyt (finanse)" wyświetla artykuły ze słowami "kredyt" i "finanse", ignorując nawiasy, nawet jeśli istnieje artykuł o dokładnej nazwie "kredyt (finanse)".

języki zapytań baz danych

Istnieje wiele funkcji, które mogą być używane z językiem zapytań.

Składnia

Język zapytań "Yandex" i "Google" możeużyj trochę znaków interpunkcyjnych, aby zawęzić wyszukiwanie. Przykładem są nawiasy klamrowe - {{search}}. Zawarte w nich wyrażenie zostanie przeszukiwane całkowicie, bez zmian.

Fraza w podwójnych cudzysłowach pozwala ci decydowaćobiekt wyszukiwania. Na przykład słowo w cudzysłowie zostanie uznane za używane w sensie graficznym lub fikcyjnym, bez cudzysłowów - jako więcej informacji dokumentacyjnych.

Ponadto wszystkie główne wyszukiwarki obsługują symbol "-" dla logicznego "nie", a także i / lub. Wyjątkiem są terminy, których nie można oddzielić łącznikiem ani myślnikiem.

Niedokładne dopasowanie szukanej frazy jest zaznaczone.symbol ~. Na przykład, jeśli nie pamiętasz dokładnego słowa lub nazwy, możesz określić ją w pasku wyszukiwania z określonym symbolem, a będziesz mógł uzyskać wyniki z maksymalnym podobieństwem.

Niestandardowe opcje wyszukiwania

Istnieją również opcje wyszukiwania, takie jak intitle,i kategoria. Są to filtry rozdzielane dwukropkami w postaci "filter: query string". Ciąg zapytania może zawierać szukany termin lub frazę, część lub pełną nazwę strony.

Funkcja "intitle: zapytanie "nadaje priorytet wynikom wyszukiwania według nazwy, ale pokazuje również zwykłe wyniki dotyczące treści tytułu. Kilka z tych filtrów może być używanych jednocześnie. Jak skorzystać z tej możliwości?

Żądanie formularza "intitle: nazwa lotniska "wyświetli w tytule wszystkie artykuły z nazwą lotniska. Jeśli sformułujemy go jako "intitle parkingowe: nazwę lotniska", to w tytule otrzymacie artykuły z nazwą lotniska i wspominając o parkingu w tekście.

Wyszukaj według filtru "incategory: Kategoria "działa na zasadzie pierwszego wydania artykułów należących do określonej grupy lub listy stron. Na przykład zapytanie wyszukiwania, takie jak "Temples incategory: History", da wyniki na temat historii świątyń. Ta funkcja może być również używana jako rozszerzona przez ustawienie różnych parametrów.