随笔-153  评论-235  文章-19  trackbacks-0
中文分词 mmseg4j 1.7.2 版发布,其实两天前就发布了,只是没有写博客而已。与引版本发布的还有 1.6.2,两者基本一样,只是词库的数据结构不同,1.7的是键树,1.6的是数组与二分查找。 mmseg4j 1.7.2 版的主要更新:
  • 修复由 1.7-beta 升级到 1.7 版的 bug:添加 lowerCaseFilter 后的一个 bug: NullPointerException。
  • 核发程序与 lucene 和 solr 扩展分开打包, 同时给出低版本的 lucene 扩展(lucene 1.9 到 2.2; lucene 2.3)
如何从源码编译:下载源码:mmseg4j-1.7.2-srcmmseg4j-1.6.2-src。解压到如:e:/mmseg4j-1.7.2-src。然后到这个目录,运行:

 




上面编译是在 solr 1.3 和 lucene 2.4 环境下的。如果您要在 低版本的 lucene 中使用,到 e:/mmseg4j-1.7.2-src/contrib/lucene_1_9 或 e:/mmseg4j-1.7.2-src/contrib/lucene_2_3 运行:

 

说明:到 contrib 下的子项目中编译的话,先要编译 mmseg4j,contrib/lucene_1_9 可以支持到 2.2。

如果有任何疑问、建议,欢迎到论坛 //groups.google.com/group/mmseg4j/topics?hl=zh_CN 讨论?;蛴胛伊?chenlb2008#gmail.com。

还要感谢网友“苦涩可乐”提示 NullPointerException 的bug。

官方博客:mmseg4j,项目:google code mmseg4j
posted on 2009-04-27 20:00 流浪汗 阅读(2762) 评论(0)  编辑  收藏 所属分类: mmseg4j

只有注册用户登录后才能发表评论。


网站导航:
 
  • 日本樱岛火山大规模喷发 烟尘高达4700米 2019-06-04
  • 陕西守艺人丨被《舌尖上的中国》忽略的洛南空心挂面 2019-06-04
  • 专家谈红军遵义整编对军改的启示:扁平化管理 减少指挥层级 2019-05-22
  • 女性之声——全国妇联 2019-05-12
  • 中国科学家给2.2万年前的大熊猫测基因 2019-05-11
  • 有神论跟无神论的差别在哪你都不知道,还要扯啥呢。 2019-05-11
  • 福州五一广场举行“十一”升国旗仪式 2019-05-08
  • 强村带弱村结对共发展 2019-04-07
  • 父亲节,你知道 有几成“男人装”? 2019-03-28
  • 苹果-热门标签-华商生活 2019-03-10
  • “奥运新秀”亮相上海 亚帆联杯等你来看 2019-03-07
  • 蔡奇就历史文化遗产保护调研:把燕都金中都建设保护好 2019-02-23
  • 红曲美的绿盒子,绿色生活大不同 2019-02-23
  • 理发迎接世界杯 梅西粉丝将偶像笑脸“抛在脑后” 2018-11-26
  • 我省各类创业孵化载体累计“毕业”企业3054家 2018-11-26
  • 11| 51| 187| 997| 820| 940| 224| 684| 774| 217|