Python difflib.SequenceMatcher()
difflib.SequenceMatcher()的语法
SequenceMatcher(isjunk=None, a='', b='', autojunk=True)
difflib.SequenceMatcher是Python标准库中的一个类,可用于比较参数a和b指定的两个序列(任何类型的序列对,只要序列元素为 hashable 对象)——比如字符串或列表等——之间的的相似性。
参数
参数 | 秒速 |
---|---|
isjunk | isjunk是一个函数,返回布尔类型的值,主要用于判定给定的需要比较的python序列中哪些元素是“垃圾”,如果被视为“垃圾”,则在比较相似性的过程中,会忽略被认为是垃圾的元素。如果isjunk的值是 None,则所有元素都被视为非垃圾。 |
a, b | 指定两个需要被比较的序列。 |
autojunk | 布尔类型值,设置自动忽略被认为是垃圾的元素。 |
返回值
通过difflib.SequenceMatcher实例对象的ratio()方法,可获取两个被比较的序列的相似度值。
difflib.SequenceMatcher()实例代码
>>> import difflib
>>> text1 = "x1y1z1.com, 笨鸟工具"
>>> text2 = "www.x1y1z1.com, python教程"
>>> matcher = difflib.SequenceMatcher(None, text1,text2)
>>> matcher.ratio()
0.6
免责声明:内容编辑自网络,仅供参考,不保证正确性,不作任何决策依据!