Quantcast
Channel: 我爱自然语言处理
Browsing all 205 articles
Browse latest View live

Image may be NSFW.
Clik here to view.

中文歌词自动生成器:来试试自动写歌

周末,基于 Hugging Face 的中文歌词模型(Chinese GPT2 Lyric Model)在AINLP公众号后台添加了中文歌词生成器,感兴趣的朋友可以关注AINLP公众号测试自动写歌: 回复“写歌+开头内容”测试,例如: HuggingFace的模型用起来很方便,示例也很简单,可以直接测试: >>> from transformers import...

View Article


Image may be NSFW.
Clik here to view.

文言文自动生成器:来试试自动写古文

前两天,我们基于 Hugging Face 的中文歌词模型(Chinese GPT2 Lyric Model)在AINLP公众号后台添加了中文歌词生成器: 中文歌词自动生成器:来试试自动写歌 今天,我们继续基于 Hugging Face 的文言文GPT2预训练模型(Chinese Ancient GPT2 Model) ,在 AINLP...

View Article


Image may be NSFW.
Clik here to view.

现代文自动生成器:来试试用GPT2自动写中文

周末,继续文本生成的话题。前几天我们基于 Hugging Face 的中文歌词GPT-2预训练模型(Chinese GPT2 Lyric Model)和文言文GPT-2预训练模型(Chinese Ancient GPT2 Model)在AINLP公众号后台添加了中文歌词生成器和文言文生成器: 中文歌词自动生成器:来试试自动写歌文言文自动生成器:来试试自动写古文 今天,我们继续基于 Hugging...

View Article

Image may be NSFW.
Clik here to view.

自然语言处理开源工具介绍系列一:英文NLP工具NLTK详解及在线测试

...

View Article

Image may be NSFW.
Clik here to view.

自动作文生成器:来试试用预训练模型自动写中文作文

周末,继续自动文本生成的话题。前些天我们基于 Hugging Face 的中文歌词GPT-2 预训练模型(Chinese GPT2 Lyric Model)、文言文 GPT-2 预训练模型(Chinese Ancient GPT2 Model)和通用中文 GPT-2 预训练模型(Chinese GPT2 Model) , 在AINLP公众号后台添加了中文歌词生成器 ,文言文生成器 和...

View Article


Image may be NSFW.
Clik here to view.

教师节,“写”一首藏头诗或者藏尾诗给恩师

今天是教师节,祝各位老师节日快乐!每次到了节日的时候,有很多朋友会利用AINLP公众号的自动写诗功能写一些祝福的古诗。今天同样可以关注AINLP公众号,然后借助AINLP的藏头诗生成器或者藏尾诗生成器给老师“写”一首藏头诗或者藏尾诗: 输入:“藏头诗 不多于8个字的藏头内容” 或者 “藏尾诗 不多于8个字的藏尾内容” 生成藏头诗生成或者藏尾诗。例如:...

View Article

Transformer 的注意力头越多越好么

多头注意力机制的目的是通过捕捉不同的注意力信息来提升 AI 模型的表达能力。利用多头矩阵的子空间从不同的视角或者说维度来表达输入的数据。 从贝叶斯神经网络的角度,多头注意力机制是一种采样(Sampling)技术, 每个注意力头是一个采样。 每个头区分度越大,相当于视角越多, 这样的话按道理Transformer 对目标可以进行更好的拟合。...

View Article

Image may be NSFW.
Clik here to view.

文言文白话文互转:文言文转白话文(现代文),白话文(现代文)转文言文

前几天,看到了东北大学小牛翻译团队开源的语料项目:文言文(古文)-现代文平行语料(https://github.com/NiuTrans/Classical-Modern) ,这个项目整理了非常全的文言文(古文)- 现代文(白话文)对齐数据,基本涵盖了大部分经典古籍著作,并且对原始爬取的篇章级对齐数据进行了断句及人工校对,形成了共计约96万句对的文言文-白话文对齐(平行)语料。...

View Article


Image may be NSFW.
Clik here to view.

Transformer中的缓存机制

作者:刘绍孔(NLP算法工程师一枚) Encoder部分相对简单,进行self-attention时只需要考虑一个batch内和长度相关的mask。这里重点讨论training和inference两种模式下decoder attention在每一层的工作机制。...

View Article


Image may be NSFW.
Clik here to view.

OCR技术发展综述与达观数据的实践经验

光学字符识别OCR技术(Optical Character Recognition)是指从图像中自动提取文字信息的技术。这项技术横跨了人工智能里的两大领域:CV(计算机视觉)和NLP(自然语言处理),综合使用了这两大领域中的很多技术成果。...

View Article

Image may be NSFW.
Clik here to view.

探索人机深度融合的高可用性人工智能应用

...

View Article

Image may be NSFW.
Clik here to view.

智能文档处理IDP关键技术与实践-高翔

什么是智能文档处理?针对文本数据处理尤其是纯文本,大家通常会想到使用自然语言处理(Natural language processing,NLP)技术来解决语义理解及分析处理工作。关于自然语言处理技术的研究有很长历史,针对不同层面文本处理和分析有很多技术点,常见技术例如分词与词性标注、命名实体识别、句法结构分析、文本分类、文本摘要等功能。...

View Article

Image may be NSFW.
Clik here to view.

知识图谱构建下的自动问答KBQA系统实战-文辉

知识图谱问答系统任务和意义 问答系统(Qusstion Answering System,QA...

View Article


Image may be NSFW.
Clik here to view.

知识图谱增强下的智能推荐系统与应用-于敬

随着互联网技术的迅速发展,尤其是移动互联网的兴起,新产生的信息呈现爆炸式的增长。为了更好地解决信息获取中的信息过载(Information Overload)和长尾问题(Long...

View Article

Image may be NSFW.
Clik here to view.

一文详解BERT模型实现NER命名实体抽取-王文广

在自然语言处理和知识图谱中,实体抽取、NER是一个基本任务,也是产业化应用NLP 和知识图谱的关键技术之一。BERT是一个大规模预训练模型,它通过精心设计的掩码语言模型(Masked Language Model,MLM)来模拟人类对语言的认知,并对数十亿个词所组成的语料进行预训练而形成强大的基础语义,形成了效果卓绝的模型。通过...

View Article


Image may be NSFW.
Clik here to view.

达观金克:RPA界面元素智能自适应定位与操控技术

什么是RPA?RPA(Robotic Process Automation,机器人流程自动化)是通过特定的、可模拟人类在计算机界面上进行操作的技术,它可以按规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作,从而节约人力成本,提高生产效率。 从RPA的定义就可以看出,对计算机界面的操控是RPA的核心之一。要实现对计算机界面的操控,就必须用到RPA界面元素定位和操控技术。...

View Article

Image may be NSFW.
Clik here to view.

多模态文档LayoutLM版面智能理解技术演进-纪传俊

多模态算法兴起的背景...

View Article


Image may be NSFW.
Clik here to view.

海量文本中挖掘人物关联关系核心技术介绍

在大数据时代,通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型,并依托人物基础特征和高层特征,实例化人物画像,支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息,同时能够基于人物画像指导人物活动规律分析、人物能力分析、人物动向分析等应用。 图1 某人物组织网络示例...

View Article

Image may be NSFW.
Clik here to view.

文字语义纠错技术探索与实践-张健

  背景     文本语义纠错的使用场景非常广泛,基本上只要涉及到写作就有文本纠错的需求。书籍面市前就有独立的校对的环节来保障出版之后不出现明显的问题。在新闻中我们也时不时看到因为文字审核没到位造成大乌龙的情况,包括上市公司在公开文书上把“临时大会”写成为“临死大会”,政府文件把“报效国家”写成了“报销国家”。有关文本纠错的辅助工具能给文字工作人员带来较大的便利,对审核方面的风险也大幅降低。...

View Article

Image may be NSFW.
Clik here to view.

多模型结合的等长拼写纠错|全国中文纠错大赛冠军方案

参与任务  中文拼写检查任务是中文自然语言处理中非常具有代表性和挑战性的任务,其本质是找出文本段落中的错别字。这项任务在各种领域,如公文,新闻、财报中都有很好的落地应用价值。而其任务的困难程度也赋予了它非常大的研究空间。达观数据在CCL2022汉语学习者文本纠错评测比赛的赛道一中文拼写检查(Chinese Spelling Check)任务中取得了全国冠军,赛道二中文语法纠错(Chinese...

View Article
Browsing all 205 articles
Browse latest View live