Archive for the 'lucene' Category
twitter的新搜索架构
星期天, 十月 10th, 2010
当习惯于粗略浏览google reader中的未读条目后便似完成任务般的“全部标记已读”,我就经常性的错过不错的精彩条目,比如这篇 Twitter’s New Search Architecture。我是订阅了engineering.twitter.com的,但这并不影响我没有注意到它就把它mark过。今天看到这篇文章时,已经有别的网站将该文翻译成中文了,比如新 Twitter,新搜索,比如 新 Twitter,新搜索,我在这也就算是炒冷饭了。
避免lucene queryparser中文分词的缺陷
星期五, 七月 9th, 2010
很多人在使用lucene时会使用其提供的queryparser分析query。不过,lucene的queryparser从一开始到现在都没有充分考虑中文等语言的特点,使得查询中文会出现让人不可理解的查不到结果的情况。这个bug就是LUCENE-2458 。