全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 284|回复: 2

一个机器学习问题,问问这个需求实现起来难不难 mjj大神多

[复制链接]
发表于 2019-6-29 19:25:23 | 显示全部楼层 |阅读模式
条件:数百万文本数据,其中完全标注的数据几十万,其余都是标注不完全的数据,输入和输出都在数据里。
需求:通过机器学习的手段,对文本特征数据进行提取,对数据进行结构化处理,对数据进行分类。

例子:        a:科威特的MJJ们是如何在室温68摄氏度下散热的呢?
                b:冰岛的MJJ们是如何在室温-68摄氏度下保暖的呢?
结构化:a 地区:科威特  对象 mjj  室温 68摄氏度  行为:散热
             b 地区:  冰岛     对象 mjj  室温 -68摄氏度 行为:保暖

在hostloc,没有解决不了的问题!
有没有好的类似的开源程序可以参考呢?
发表于 2019-6-29 19:38:40 | 显示全部楼层
这是nlp里的命名实体识别吧

点评

我发现 hanlp 分词就可以实现我的大部分需求...  发表于 2019-6-29 19:58
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-24 21:29 , Processed in 0.068929 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表