今天的Python培训,我们讲解一下什么是文本相似度。在自然语言处理中,经常会涉及度量两个文本的相似性问题,在诸如信息检索、数据挖掘、机器翻译、文档复制检测等领域中...查看全文>>
在调用模块中的函数时,之所以要加上模块名,是因为在多个模块中,可能存在名称相同的函数,此时如果只是通过函数名来调用...查看全文>>
作为数据仓库和ETL的开发者,如果只想把时间用在创建BI解决方案上,那么任何用于软件安装和配置的时间都是一种浪费。例如,为了创建数据库连接,很多与Kettle类似的工具都要求用户手工输入数据库驱动的类名...查看全文>>
Python经常被用于Web开发。例如,通过mod_wsgi模块,Apache可以运行用Python编写的Web程序。Python定义了WSGI标准应用接口来协调HTTP服务器与基于Python的Web程序之间的通信...查看全文>>
文本分词是预处理过程中必不可少的一个操作,它可以分为两步:第一步是构造词典,第二步是分词算法的操作。其中,词典的构造比较流行的是双数组的trie树查看全文>>
concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并,该函数的语法格式如下...查看全文>>