Docker 部署Python项目
Docker 部署Python项目 导读: 软件开发最大的麻烦事之一就是环境配置,操作系统设置,各种库和组件的安装。只有它们都正确,软件才能运行。如果从一种操作系统里面运行另一种操作系统,通常我们采取的策略就是引入虚拟机,比如在 Windows 系统里面运行 Linux 系统。这种方式有个很大的缺点就是资源占用多、冗余步骤多、启动慢。目前最流行的 Linux...
View ArticlePython 和 Elasticsearch 构建简易搜索
1 ES基本介绍 概念介绍 Elasticsearch是一个基于Lucene库的搜索引擎。它提供了一个分布式、支持多租户的全文搜索引擎,它可以快速地储存、搜索和分析海量数据。Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。Elasticsearch至少需要Java...
View Article自然语言理解太难了之中文分词八级测试
前几天在微博看到了一个例子:无线电法国别研究 赶紧用AINLP公众号后台的中文分词和词性标注测试功能试了一下八款中文分词(词性标注)工具或者模块: 结果如预期一样,大部分中文分词工具翻车了,不过这个例子别说对于中文分词工具,即使人工分词也需要反应一下。这也让我想起了之前转载的杨洋同学整理,刘群老师在微博上发起的#自然语言理解太难了#话题:NLP is hard! 自然语言处理太难了系列...
View Article词向量游戏:一些有意思的例子
自从把腾讯词向量对接到AINLP公众号后台后,发现相似词相关的查询需求是逐渐增大的,已经不止一次有非CS专业的同学通过后台查询相似词或者相似度来做课程设计,这让我觉得这个事情有一些意义,当然,通过微信(公众号)后台快速查询相似词(同义词、近义词、反义词)这个需求应该是更普遍的,欢迎推荐给有需求的朋友。关于词向量、相似词、相似度、词语加减,这里写了一些文章: 相似词查询:玩转腾讯 AI Lab...
View Article百度深度学习中文词法分析工具LAC试用之旅
之前在调研中文分词和词性标注相关工具的时候就发现了百度的深度学习中文词法分析工具:baidu/lac(https://github.com/baidu/lac),但是通过这个项目github上的文档描述以及实际动手尝试源码编译安装发现非常繁琐,缺乏通常中文分词工具的易用性,所以第一次接触完百度lac之后就放弃了:...
View ArticleAINLP公众号"自动作诗机"上线
最近对自然语言生成或者文本自动生成技术比较感兴趣,做了一些调研,作为自然语言处理领域的难题之一,个人一直觉得自然语言生成(NLG)是最难的,虽然这一两年动辄会看机器模仿莎士比亚写剧本,模仿金庸写小说,这些不过是媒体用来吸引眼球的,总之这些字凑到一起看起来像模像样,但是读了之后不知所云。不过对于特定格式的文本,类似诗歌这种,如果不细究,从直观的角度来看确实还有点像那么回事,例如清华大学自然语言处理与社...
View Article百度深度学习中文情感分析工具Senta试用及在线测试
情感分析是自然语言处理里面一个热门话题,去年参加AI Challenger时关注了一下细粒度情感分析赛道,当时模仿baseline写了一个fasttext版本:AI Challenger 2018 细粒度用户评论情感分析 fastText Baseline ,至今不断有同学在star这个项目:fastText-for-AI-Challenger-Sentiment-Analysis...
View ArticleAINLP公众号新增SnowNLP情感分析模块
上周给AINLP公众号对话增加了百度中文情感分析接口:百度深度学习中文情感分析工具Senta试用及在线测试,很多同学通过公众号对话进行测试,玩得很嗨,不过感觉中文情感分析的成熟工具还是不多。这个周末调研了一下之前用于测试中文分词和词性标注的工具,发现SnowNLP和HanLP提供情感分析的接口,不过后者貌似没有提供Python接口,而SnowNLP作为原生的Python中文自然语言处理工具包,用起来...
View Article第三届“达观杯”文本智能信息抽取挑战赛强势来袭,奖金 Offer你想要的都在这里!
“达观杯”是由达观数据主办的全国前沿人工智能和大数据技术竞赛,面向全国数百所高等院校本科及以上学生、大型科技企业和初创科技企业研发人员及各行业数据工作者、爱好者展开,意在发现更多技术人才,共同在NLP应用系统的开发实现突破,促进人工智能产业发展。 自 2017 年“达观杯”算法挑战赛开始以来,两年的时间在NLP 的技术圈吸引了近万名技术爱好者,选手们在比赛拿奖后申请到了TOP海外高校,收获了心仪的...
View Article欢迎关注AINLP:一个有趣有AI的NLP公众号
我们的公众号AINLP,致力于做一个有趣有AI的NLP公众号,作者是我爱自然语言处理博客博主,NLPJob、课程图谱网站"保姆",曾在腾讯从事文本挖掘相关工作。AINLP...
View ArticleAINLP公众号对话接口新增成语接龙
成语接龙很有意思,原本计划找一些成语语料自己做一个,不过Google一圈后发现Github上有一个现成的项目:IdiomsSolitaire Github链接:https://github.com/WangYihang/IdiomsSolitaire 这个项目自带2万多条成语数据,用法也很简单: API Usage >>> import IdiomsSolitaire...
View ArticleDocker 部署Python项目
Docker 部署Python项目 导读: 软件开发最大的麻烦事之一就是环境配置,操作系统设置,各种库和组件的安装。只有它们都正确,软件才能运行。如果从一种操作系统里面运行另一种操作系统,通常我们采取的策略就是引入虚拟机,比如在 Windows 系统里面运行 Linux 系统。这种方式有个很大的缺点就是资源占用多、冗余步骤多、启动慢。目前最流行的 Linux...
View Article推荐一份中文数据,再试试汉字、词语、成语、歇后语在线检索
前段时间给公众号新增了一个成语接龙功能:AINLP公众号对话接口新增成语接龙,这个里面提到的项目用到了一份成语数据,包含了2万多条成语数据和释义。不过这个数据之外,推荐一个更棒的Github项目: pwxcoo/chinese-xinhua:https://github.com/pwxcoo/chinese-xinhua 这个项目收录了收录了 14032 条歇后语,16142 个汉字,264434...
View Article中文自然语言处理相关的开放任务,数据集, 以及当前最佳结果
强烈推荐一个项目:Chinese NLP ,这是由滴滴人工智能实验室所属的自然语言处理团队创建并维护的,该项目非常细致的整理了中文自然语言处理相关任务、数据集及当前最佳结果,相当完备。 项目主页:https://chinesenlp.xyz Github: https://github.com/didi/ChineseNLP 这个项目里面目前包含了18个中文自然语言处理任务,以及一个其他类别:...
View Article通过Docker部署深度学习项目环境
深度学习环境部署的方法有很多种,其中Docker化深度学习环境和项目是一个很不错的选择。这里写过一些深度学习主机安装和部署的文章,这篇文章记录一下相关的通过Docker来部署和测试深度学习项目的一些经验,以下是在一台4卡1080TI,Ubutu16.04的机器上的记录。 一、安装Docker: 关于Docker的相关介绍资料比较多,这里就不多说了,感兴趣的同学可以自行Google或者看一下参考资料。...
View ArticleClause,开源的语义理解服务
Clause Chatopera Language Understanding Service,Chatopera 语义理解服务 https://github.com/chatopera/clause Clause 是帮助中小型企业快速而低成本的获得好用的语义理解服务的系统。 Clause 是 Chatopera 团队自主研发及使用其他商业友好的开源软件的方式实现的,Clause...
View Article推荐两份NLP读书笔记和一份NLTK书籍代码中文注释版
推荐一下AINLP技术交流群里 zYx.tom 同学贡献给大家的两份NLP读书笔记和一份中文注释代码,包括: 《自然语言处理综论》中文版第二版学习笔记 《计算机自然语言处理》学习笔记 《Python自然语言处理》学习代码的中文注释版本:NLTK-Python-CN 作者博客:https://zhuyuanxiang.github.io/...
View ArticleAINLP-DBC GPU 云服务器租用平台建立,价格足够便宜
我用过不少深度学习服务器,也包括一些GPU云服务器,相对来说,GPU云服务器是比较贵的。最近深脑链的同学让我试用了通过DBC Token结算的GPU云服务器,感觉相当的便宜和好用,所以尝试推荐大家试用,我们和深脑链达成合作,建立了AINLP-DBC GPU云服务器租用平台:https://gpu.ainlp.cn 需要提前说明的时候,基于深脑链技术提供的GPU服务平台是采用数字货币DBC...
View ArticleRasa 入坑指南二:基于 Rasa 构建天气查询机器人
天气查询是聊天机器人里面常见和常用的功能之一,本文基于 Rasa 构建一个中文的天气查询机器人。幸运的是,这件事已经有同学操作过了:使用 Rasa 构建天气查询机器人,不仅有文章,还有训练数据和相关代码,以及Web UI查询界面,相当完备。而问题在于, Rasa的版本跳跃貌似比较大,我接触Rasa比较晚,第一篇文章《Rasa入坑指南一:初识Rasa》使用的Rasa版本是...
View Article