首页 > 产品 > 问答 > mmseg,coreseek 安装完成后 怎么调用接口

mmseg,coreseek 安装完成后 怎么调用接口

来源:整理 时间:2024-12-20 06:22:26 编辑:智能门户 手机版

1,coreseek 安装完成后 怎么调用接口

任务占坑

coreseek 安装完成后 怎么调用接口

2,win mmseg需要单独安装吗

简答:1.安装mingw也可以;2.或者使用已有的vs2010去编译也可以。详解:参考我的:【已解决】安装Python模块mmseg出错:error:Unabletofindvcvarsall.bat(此处不能贴地址,请自己用google搜标题,即可找到帖子地址)
应该不用吧。

win mmseg需要单独安装吗

3,IKAnalyzer2012 和mmseg 用哪个更好IKAnalyzer2012支持lucene35

IKAnalyzer2012支持lucene3.5的,IKAnalyzer2012包里有默认的IKAnalyzer.cfg.xml,在里面可以扩展配置你的词典和停用词典,象这样:/ext_stopword.dic; entry> ,ext_stopword.dic文件里就是你加入的停用词,一行一个词的格式就行

IKAnalyzer2012 和mmseg 用哪个更好IKAnalyzer2012支持lucene35

4,Coreseek 有这个还用安装 sphinx 么

不需要,编译安装好coreseek里面的两个文件包就可以,先安装mmseg,再安装另外一个。./configure --prefix=/usr/local/mmseg若有错误提示运行automake命令 ./configure --prefix=/usr/local/coreseek --with-mysql=/usr/local/mysql --with-mmseg=/usr/local/mmseg --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/

5,jcseg如何放入自己的关键词

Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!Jcseg-1.9.7:1. 词库优化:增加新词,去掉一些无用词,部分词条词性优化。2. 增加文章关键字提取:基于textRank算法。3. 增加文章关键短语提取:基于textRank算法。4. 增加文章关键句子/文章摘要提取:基于BM25+textRank算法。5. 增加jcseg-server模块:嵌入jetty,提供了一个高性能的服务器,给关键字提取,关键短语提取,关键句子提取,文章摘要提取,中文分词都提供了restful api,并且标准为json结果输出! [详细文档]6. 终端测试程序增加关键字/关键短语/关键句子/摘要提取测试项。
支持一下感觉挺不错的

6,中文分词的常见项目

我猜你是 想问不规则动词的过去分词吧? 1. a---a---a型(现在式、过去式和过去分词同形) 动词原形(现在式)过去式 过去分词 cost cost cost 花费 cut cut cut 割,切 hit hit hit 打 let let let 让 put put put 放下 read read read 读 hurt hurt hurt 伤 2. a---a---b型(现在式和过去式同形) beat beat beaten 打 3. a---b---a型(现在式和过去分词同形) come came come 来 become became become 变 run ran run 跑 overcome overcame overcome征服,打败,克服 4. a ---b ---b型 (1)在动词原形后加一个辅音字母d或t构成过去式或过去分词。 burn burnt burnt 燃烧 learn learned/learnt learned/learnt 学习 mean meant meant 意思 hear heard heard 听见 (2)把动词原形的最后一个辅音字母“d”改为“t” 构成过去式或过去分词。 build built built 建筑 lend lent lent 借给 lose lost lost 失去 send sent sent 送 spend spent spent 花费 (3) pay paid paid 付 lay laid laid 下蛋 say said said 说 (4) bring brought brought 带来 buy bought bought 买 fight fought fought 战斗 think thought thought 想 (5) sleep slept slept 睡 feel felt felt 觉得 keep kept kept 保持 sweep swept swept 扫 (6) stand stood stood 站 understand understood understood 明白 (7) win won won 得胜 (8) catch caught caught 抓住 teach taught taught 教 (9) find found found 发现 get got got 得到 hold held held 盛,握 leave left left 离开 make made made 制造 meet met met 遇见 shoot shot shot 射击 dig dug dug 挖 (10) shsmell smelt/smelled smelt/smelled 嗅,闻 shine shone/shined shone/shined 发光 (11) tell told told 告诉 sell sold sold 卖 (12) sit sat sat 坐 have had had 有 5. a---b---c型(现在式、过去式和过去分词都不相同) (1)在动词原形后加-n或-en构成过去分词。 eat ate eaten 吃 fall fell fallen 落下 steal stole stolen 偷 give gave given 给 freeze froze frozen 冻结 take took taken 拿 see saw seen 看见 write wrote written 写 ride rode ridden 骑 drive drove driven 驾驶 throw threw thrown 抛,扔 blow blew blown 吹 grow grew grown 生长 know knew known 知道 fly flew flown 飞 draw drew drawn 拉,绘画 show showed shown 展示 (2)过去式加-n或-en构成过去分词。 speak spoke spoken 说话 break broke broken 破碎,折断 wake waked/ woke waked/ waken 醒 choose chose chosen 选择 forget forgot forgotten 忘记 (3)变单词在重读音节中的元音字母“i”分别为“a”(过去式)和“u”(过去分词)。 begin began begun 开始 ring rang rung 按铃 sing sang sung 唱 sink sank sunk 沉 swim swam swum 游泳 drink drank drunk 饮 (4)其他不规则动词的变化。 be(am, is) was/ were been 是 be(are) were been 是 do did done 做 go went gone 去 lie lay lain 躺 wear wore worn 穿
功能性能 功能描述:1.新词自动识别对词典中不存在的词,可以自动识别,对词典的依赖较小;2.词性输出分词结果中带有丰富的词性;3.动态词性输出分词结果中的词性并非固定,会根据不同的语境,赋予不同的词性;4.特殊词识别比如化学、药品等行业词汇,地名、品牌、媒体名等;5.智能歧义解决根据内部规则,智能解决常见分词歧义问题;6.多种编码识别自动识别各种单一编码,并支持混合编码;7.数词量词优化自动识别数量词; 性能介绍:处理器:AMD Athlon II x2 250 3GHZ单线程大于833KB/s,多线程安全。 一个PHP函数实现中文分词。使分词更容易,使用如下图: Paoding(庖丁解牛分词)基于Java的开源中文分词组件,提供lucene和solr 接口,具有极 高效率和 高扩展性。引入隐喻,采用完全的面向对象设计,构思先进。高效率:在PIII 1G内存个人机器上,1秒可准确分词 100万汉字。采用基于 不限制个数的词典文件对文章进行有效切分,使能够将对词汇分类定义。能够对未知的词汇进行合理解析。仅支持Java语言。 MMSEG4J基于Java的开源中文分词组件,提供lucene和solr 接口:1.mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。2.MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j 已经实现了这两种分词算法。 盘古分词是一个基于.net 平台的开源中文分词组件,提供lucene(.net 版本) 和HubbleDotNet的接口高效:Core Duo 1.8 GHz 下单线程 分词速度为 390K 字符每秒准确:盘古分词采用字典和统计结合的分词算法,分词准确率较高。功能:盘古分词提供中文人名识别,简繁混合分词,多元分词,英文词根化,强制一元分词,词频优先分词,停用词过滤,英文专名提取等一系列功能。 jcseg是使用Java开发的一个中文分词器,使用流行的mmseg算法实现。 1。mmseg四种过滤算法,分词准确率达到了98.4%以上。2。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类,词库整合了《现代汉语词典》和cc-cedict辞典。3。词条拼音和同义词支持,jcseg为所有词条标注了拼音,并且词条可以添加同义词集合,jcseg会自动将拼音和同义词加入到分词结果中。4。中文数字和分数识别,例如:"四五十个人都来了,三十分之一。"中的"四五十"和"三十分之一",并且jcseg会自动将其转换为对应的阿拉伯数字。5。支持中英混合词的识别。例如:B超,x射线。6。支持基本单字单位的识别,例如2012年。7。良好的英文支持,自动识别电子邮件,网址,分数,小数,百分数……。8。智能圆角半角转换处理。9。特殊字母识别:例如:Ⅰ,Ⅱ10。特殊数字识别:例如:①,⑩11。配对标点内容提取:例如:最好的Java书《java编程思想》,畅想杯黑客技术大赛,被《,,“,『标点标记的内容。12。智能中文人名识别。中文人名识别正确率达94%以上。jcseg佩带了jcseg.properties配置文档,使用文本编辑器就可以自主的编辑其选项,配置适合不同应用场合的分词应用。例如:最大匹配分词数,是否开启中文人名识别,是否载入词条拼音,是否载入词条同义词……。 friso是使用c语言开发的一个中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。并且提供了一个php中文分词扩展robbe。1。只支持UTF-8编码。【源码无需修改就能在各种平台下编译使用,加载完20万的词条,内存占用稳定为14M。】。2。mmseg四种过滤算法,分词准确率达到了98.41%。3。支持自定义词库。在dict文件夹下,可以随便添加/删除/更改词库和词库词条,并且对词库进行了分类。4。词库使用了friso的Java版本jcseg的简化词库。5。支持中英混合词的识别。例如:c语言,IC卡。7。很好的英文支持,电子邮件,网址,小数,分数,百分数。8。支持阿拉伯数字基本单字单位的识别,例如2012年,5吨,120斤。9。自动英文圆角/半角,大写/小写转换。并且具有很高的分词速度:简单模式:3.7M/秒,复杂模式:1.8M/秒。
文章TAG:安装完成怎么调用mmseg安装完成后怎么调用接口

最近更新

  • 1305,1305合约是什么意思1305,1305合约是什么意思

    1305合约是什么意思2,联通宽带出现代码是1305是什么意思3,联通电视故障代码1305怎么回事4,联通宽带出现的错误代码是1305怎么办5,违章1305代码是什么意思6,为什么联通IPTV网络连接失败网络.....

    问答 日期:2024-12-20

  • 非标自动化试压设备,什么叫非标自动化设备?非标自动化试压设备,什么叫非标自动化设备?

    什么是非标准自动化设备?有哪些非标准的自动化设备?非标自动化,相对于标准化设备,是根据客户的需求来满足客户的需求。非标自动化是指机械行业私人定制的自动化设备,非标自动化设备和非标设.....

    问答 日期:2024-12-20

  • fae是什么意思,fae是什么意思fae是什么意思,fae是什么意思

    fae是什么意思2,公司的FAE是什么3,FAE是什么意思4,谁知道有关FAE的基本知识5,FAE经理是什么经理6,FAE什么意思1,fae是什么意思```SORRY`~哎`~`无能为力`!2,公司的FAE是什么应该按专业不同有不.....

    问答 日期:2024-12-20

  • 电脑怎样长截图,求教电脑怎么截长图电脑怎样长截图,求教电脑怎么截长图

    求教电脑怎么截长图2,请问电脑怎么可以长截图3,如何用电脑截很长很长的图就是超过屏幕很多的那种急4,问一问大家电脑怎么长截屏5,怎么在电脑上截长图6,电脑如何截大图1,求教电脑怎么截长图需.....

    问答 日期:2024-12-20

  • 黄a视频,101次求婚电影全集观看黄a视频,101次求婚电影全集观看

    101次求婚电影全集观看2,海信电视led42k680x3dv怎么连接机顶盒3,哪有黄版妖精的尾巴视频4,AV是什么意思S视频是什么意思他们有什么区别5,夏普58su760a电视怎样接机顶盒6,家庭影院怎么连接1,1.....

    问答 日期:2024-12-20

  • 公牛插排自动化设备有哪些,牛车水电力配件厂家有哪些?公牛插排自动化设备有哪些,牛车水电力配件厂家有哪些?

    有哪些牛的外挂机型?公牛插座型号分类公牛插座型号价格公牛电源插座的生产厂家有哪些?现在家里电器太多了,选购插座需要好的。但是市面上的插座种类繁多,有人说公牛插座好,但是他们的厂家是.....

    问答 日期:2024-12-20

  • oin,我想改反恐精英oin 不知道怎么改号oin,我想改反恐精英oin 不知道怎么改号

    我想改反恐精英oin不知道怎么改号既然你注册了就不能再改了,如果你想改角色名的话,就去商城买角色改名道具,250游戏币一个,很贵的建议你别别买了2,Oin什么意思翻译是嗡亲啊OINn.石油印度有.....

    问答 日期:2024-12-20

  • 编织袋缝纫自动化设备生产厂家,编织袋生产厂需要什么设备?编织袋缝纫自动化设备生产厂家,编织袋生产厂需要什么设备?

    生产编织袋需要什么设备?开一个编织袋厂需要多少机器设备?编织袋生产厂家地址编织袋生产厂家地址:探访编织袋之都在中国江苏省,有一个地方叫“编织袋之都”,就是大丰市。编织袋生产厂家编.....

    问答 日期:2024-12-19