今天将 oracle 数据库中的一份表 235万条数据 dataImport 进 solr4.4 进行索引。导入后发现。 solr提示数据全部导入成功, 但是query时候只有 70万条数据。 一直傻傻的闷了半天。。。。。。why?
原来是 schema.xml 的 <uniqueKey>NewsID</uniqueKey> 搞鬼。 这个设定的字段最好是表内可以代表唯一索引(主键一般是), solr导入时候会自动去除重复值。。所以我之前设置的字段并非唯一索引。。。。
低级错误啊!!
本文分享了一次使用Solr 4.4进行大规模数据导入的经验。在尝试导入235万条记录时遇到了实际索引数量远低于预期的问题。通过排查发现是因为schema.xml中的uniqueKey设置不当导致数据去重,最终定位并解决了问题。
今天将 oracle 数据库中的一份表 235万条数据 dataImport 进 solr4.4 进行索引。导入后发现。 solr提示数据全部导入成功, 但是query时候只有 70万条数据。 一直傻傻的闷了半天。。。。。。why?
原来是 schema.xml 的 <uniqueKey>NewsID</uniqueKey> 搞鬼。 这个设定的字段最好是表内可以代表唯一索引(主键一般是), solr导入时候会自动去除重复值。。所以我之前设置的字段并非唯一索引。。。。
低级错误啊!!
251

被折叠的 条评论
为什么被折叠?