承接国内外服务器租用托管、定制开发、网站代运营、网站seo优化托管接单、网站代更新,新老站点皆可!!咨询QQ:3787320601

mongodb处理中文索引与查找字符串详解

管理员 2023-05-23 08:36:17 网站建设 18 ℃ 0 评论 7930字 收藏

mongodb处理中文索引与查找字符串详解

参考文献

首先自打3.2版本以后,就开始支持中文索引了,支持的所有的语言参考这里:

https://docs.mongodb.com/manual/reference/text-search-languages/

然后,对要支持索引的表需要建议text index,怎么建立参考这里:

https://docs.mongodb.com/manual/core/index-text/

在建好索引text以后,如果检索参考:

https://docs.mongodb.com/manual/reference/operator/query/text/

实例

我有一个表,定义以下:

var ArticleSchema = new Schema({
created: {
type: Date,
default: Date.now
},
title: {
type: String,
default: ”,
trim: true,
required: ‘Title cannot be blank’
},
abstract: {
type: String,
default: ”,
trim: true
},
abstractImg: {
type: String,
default: ‘/upload/allimg/2023/04/24/pgkh5z1er0y.png’,
trim: true
},
content: {
type: String,
default: ”,
trim: true
},
category: {
type: String,
default: ‘news’,
trim: true
},
user: {
type: Schema.ObjectId,
ref: ‘User’
},
toPublish: {
type: Boolean,
default: true
},
comments: [CommentSchema]
});

然后,里面有数据的,所以我直接检索,得到结果:

> db.articles.find( { $text: { $search: “coffee” } } )
Error: error: {
“waitedMS” : NumberLong(0),
“ok” : 0,
“errmsg” : “text index required for $text query”,
“code” : 27
}

说明没有建议text索引,那末建一个:

db.articles.createIndex( {title: “text”, content: “text” })

看看效果:

> db.articles.createIndex(
… {
… title: “text”,
… content: “text”
… }
… )

下面是结果,成功了

{
“createdCollectionAutomatically” : false,
“numIndexesBefore” : 1,
“numIndexesAfter” : 2,
“ok” : 1
}

然后我开始检索:

> db.articles.find( { $text: { $search: “coffee” } } )

甚么都没有。

我检索一个存在的中文:

> db.articles.find( { $text: { $search: “操作” } } )
{ “_id” : ObjectId(“58b0eb5a136dc51b541eaf81”), “user” : ObjectId(“589c8d22f7d9dc15989be255”), “comments” : [ ], “toPublish” : true, “category” : “blog”, “content” : “<p> </p><p><br/></p><p>其实就是使用ubuntu 16的安装方式,参考网址:</p><p><a href=\”https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/\” target=\”_blank\”>https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/</a></p><p><br/></p><p>我的操作步骤:</p><pre>1.倒入key:sudo apt-key adv –keyserver hkp://keyserver.ubuntu.com:80 –recv EA312927 </pre><p><br/></p><p>2. 创建mongodb的软件源:</p><p>/etc/apt/sources.list.d/mongodb-org⑶.2.list</p><p>操作:</p><pre>echo "deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.2 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org⑶.2.list </pre><p><br/></p><p>3. 更新系统:</p><p>sudo apt update</p><p>以后查看所有可以更新的软件:</p><p>sudo apt list –upgradable</p><p>然后升级所有软件:</p><p>sudo apt upgrade</p><p><br/></p><p>4. 安装mongodb :</p><p>sudo apt install -y mongodb-org</p><p>也能够指定版本安装:</p><p>sudo apt-get install -y mongodb-org=3.2.8 mongodb-org-server=3.2.8 mongodb-org-shell=3.2.8 mongodb-org-mongos=3.2.8 mongodb-org-tools=3.2.8</p><p>不过我不使用这类方式。</p><p><br/></p><p>5. 添加systemd 自启动条目:</p><p>sudo vim /lib/systemd/system/mongod.service</p><p>添加内容:</p><p>[Unit]</p><p>Description=High-performance, schema-free document-oriented database</p><p>After=network.target</p><p>Documentation=https://docs.mongodb.org/manual</p><p><br/></p><p>[Service]</p><p>User=mongodb</p><p>Group=mongodb</p><p>ExecStart=/usr/bin/mongod –quiet –config /etc/mongod.conf</p><p><br/></p><p>[Install]</p><p>WantedBy=multi-user.target</p><p><br/></p><h2>6. 使能和启动服务:</h2><p>sudo systemctl enable mongod.service</p><p>sudo systemctl start mongod.service</p><p><br/></p><h2>查看状态,一切ok。</h2><p>sudo systemctl status mongod.service</p><p>● mongod.service – High-performance, schema-free document-oriented database</p><p>Loaded: loaded (/lib/systemd/system/mongod.service; enabled; vendor preset: enabled)</p><p>Active: active (running) since Sun 2016-07⑶1 21:59:00 CST; 13min ago</p><p>Docs: https://docs.mongodb.org/manual</p><p>Main PID: 19374 (mongod)</p><p>CGroup: /system.slice/mongod.service</p><p>└─19374 /usr/bin/mongod –quiet –config /etc/mongod.conf</p><p><br/></p><p>Jul 31 21:59:00 mint systemd[1]: Started High-performance, schema-free document-oriented database.</p><p><br/></p><p>7. 查看服务启动端口会不会ok:</p><p>azuo1228@mint ~/webproj/mjs2/meanjs $ netstat -apn | grep mong</p><p>(Not all processes could be identified, non-owned process info</p><p>will not be shown, you would have to be root to see it all.)</p><p>unix 2 [ ACC ] STREAM LISTENING 76731 – /tmp/mongodb⑵7017.sock</p><p><br/></p><p><br/></p>”, “abstractImg” : “https://www.wanzijz.com/wp-content/uploads/2023/02/1676896933⑴4eb0a385a8e745.png”, “abstract” : “其实就是使用ubuntu 16的安装方式,参考网址:”, “title” : “其实就是使用ubuntu 16的安装方式,参考网址:”, “created” : ISODate(“2017-02⑵5T02:26:34.483Z”), “__v” : 0 }
>

最后

但是这类检索都是不完善的,如果需要更好的支持,就需要参考:

https://docs.mongodb.com/manual/tutorial/text-search-with-rlp/

安装rlp支持mongodb检索中文,但是不是是不要钱的。。。

所以,最好的方式就是使用Elastic Search同步mongodb,然后通过它检索,超越本文范围了,以后再说。

总结

本篇文章到此结束,如果您有相关技术方面疑问可以联系我们技术人员远程解决,感谢大家支持本站!

文章来源:丸子建站

文章标题:mongodb处理中文索引与查找字符串详解

https://www.wanzijz.com/view/39462.html

X

截屏,微信识别二维码

微信号:weimawl

(点击微信号复制,添加好友)

打开微信