如果数据可以被结构化,那么当今可用的大量非结构化文本数据提供了丰富的信息来源。 命名实体识别 (NER)(也称为命名实体提取)是从半结构化和非结构化文本源构建知识的第一步。
只有在 NER 之后,我们才能至少揭示信息包含的内容和内容。 因此,数据科学团队将能够在语料库中看到所有人员、公司、地点等名称的结构化表示,可作为进一步分析和调查的出发点。
在 自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别 文章中,我们学习并实践了如何使用 NLTK 和 spaCy 构建命名实体识别器。 为了更进一步,创建一些有用的东西,本文将介绍如何使用 spaCy 开发和部署一个简单的命名实体提取器,并使用 Python 中的 Flask API 为其提供服务。
Flask API 步骤
index.html 中处理及其代码
Python 主代码 app.py 及其分解解释
测试 Flask API
源代码
详情参阅http://viadean.com/spacy_python_flask_api.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。