www.boolean.name

www.boolean.name (http://forum.boolean.name/index.php)
-   Полезные функции (http://forum.boolean.name/forumdisplay.php?f=17)
-   -   Нечеткий поиск (http://forum.boolean.name/showthread.php?t=20047)

DarkInside 19.10.2015 20:19

Нечеткий поиск
 
Вложений: 1
Написал простой алгоритм нечеткого поиска путем разбиения по слогам исходной строки (которую сравниваем) и строки, с которой сравниваем. Может кому пригодится ;)
Из особенностей можно выделить возможность поиска с одинарной и двойной (со смещением на -1 символ) точностью.
На скорость, как в гугле, не претендую. Тут простой перебор, без математики. Даже без бинарных операций. Но для моих задач (поиск по базе 100-200 элементов) скорости вполне хватает.
Учитывается длина строк, количество слов.
Выдает степень совпадения в процентах.

DarkInside 17.02.2017 21:28

Ответ: Нечеткий поиск
 
Вложений: 1
DLL (+decls) находит расстояние Левенштейна между строками.

Расстояние = 1 - строки отличаются в пределах погрешности ввода.
Расстояние = 5 - строки совсем разные.

Пример:
Код:

RuntimeError fuzzy_len("boolean", "bolean")


Часовой пояс GMT +1, время: 01:52.

vBulletin® Version 3.6.5.
Copyright ©2000 - 2020, Jelsoft Enterprises Ltd.
Перевод: zCarot