Co to jest dopasowanie rozmyte?

Dopasowywanie rozmyte to metoda stosowana w niektórych programach komputerowych, zwłaszcza tych zaprojektowanych do automatycznego tłumaczenia tekstu między różnymi językami. Działa w sytuacjach, gdy baza danych używana przez oprogramowanie nie ma dokładnego dopasowania do fragmentu tekstu. Zamiast tego baza danych szuka bliskich dopasowań, a ludzka wersja zwykle sprawdza, czy to dopasowanie jest zadowalająco dokładne.

Większość programów do automatycznego tłumaczenia po prostu porównuje tekst z bazą danych poprzednich tłumaczeń. Ta baza danych jest zwykle nazywana pamięcią tłumaczeniową (TM). Każde nowe i potwierdzone tłumaczenie jest dodawane do bazy danych, co oznacza, że ​​przyszłe tłumaczenia są zazwyczaj dokładniejsze i szybsze.

Zwykle tłumaczenie oparte na bazie TM działa z całymi zdaniami. Na przykład, jeśli użytkownik wcześniej zatwierdził określone zdanie w języku francuskim jako dokładne tłumaczenie: „Sklep jest otwarty między 9 rano a 5 w dni powszednie, ale zamyka się o 2 w środę”, to następnym razem, gdy oprogramowanie zostanie poproszony o przetłumaczenie tego zdania, automatycznie użyje tego samego francuskiego sformułowania, co poprzednio.

Narzędzie do dopasowywania rozmytego działa w sytuacjach, w których dana fraza nie pojawiła się wcześniej w przetłumaczonych przez system dokumentach. Narzędzie polega na ustawieniu przez twórcę oprogramowania lub użytkownika końcowego akceptowalnego poziomu dopasowania rozmytego w postaci dopasowania procentowego. Jeśli fraza jest wystarczająco zbliżona do poprzednio przetłumaczonego, aby spełnić ten procent dopasowania, oprogramowanie poinformuje użytkownika o dopasowaniu, poda poprzednie tłumaczenie i poprosi użytkownika o potwierdzenie lub edycję proponowanego tłumaczenia.

Kontynuując poprzedni przykład, jeśli próg dopasowania rozmytego został ustawiony na 90%, a nowy dokument w języku angielskim zawierał zdanie: „Sklep jest otwierany między 9 a 5 w dni powszednie, ale zamykany o 2 w środę”, oprogramowanie zasugeruje poprzednio używane tłumaczenie, a użytkownik prawdopodobnie kliknie, aby je zatwierdzić. Gdyby nowy dokument zawierał zdanie „Sklep jest otwarty między 9 a 5 w dni powszednie, ale zamykany o 2 w czwartek”, oprogramowanie zasugeruje poprzednio używane tłumaczenie, a użytkownik poprawi to tłumaczenie, aby zakończyć z Francuskie słowo oznaczające czwartek. Gdyby nowy dokument zawierał zdanie „Sklep jest otwarty od 9:5 do 2:XNUMX w każdy dzień powszedni z wyjątkiem środy, kiedy jest zamykany o XNUMX:XNUMX”, oprogramowanie nie uznałoby tego za rozmyte dopasowanie, pomimo tego samego znaczenia, i tym samym nie oferowałby automatycznego tłumaczenia zdania, pozostawiając użytkownikowi przetłumaczenie go ręcznie.