ぶろぐ

日記です

レーベンシュタイン距離


サジェストで使うアルゴリズム

#!/usr/bin/env python
# coding: utf8

import Levenshtein
import sys

inputString = sys.argv[1].decode('utf-8')

strings = [
"大城しゅうじ",
"大城ひろし",
"大城隆史",
"天野かつた",
"比嘉太郎",
"比嘉まさし",
"大城まさし",
"辺土名まさし",
"オダスキーさん"
]

for s in strings:
  l = Levenshtein.distance(inputString, s.decode('utf-8'))
  if (l <= 3):
    print(" 距離: " + str(l) +  ", もしかして: " + s)