/**
* Created by ionio on 2017/6/10.
* requier:
* npm --registry=http://r.cnpmjs.org install nodejieba
*/
var nodejieba = require("nodejieba");
// 自定义词的权重
nodejieba.load({
//包含词性的标注、词权重、新词
/**
地瓜 9999 n
金箍 9999 n
老孙 9999
棒就棒在 9999
性能
HTTP/2
* */
userDict: './word-weight.txt'
});
// =======分词=============
var result = nodejieba.cut("帝国主义要把我们的地瓜分掉");
console.log(result);
result = nodejieba.cut('土地,俺老孙的金箍棒在哪里?');
console.log(result);
result = nodejieba.cut('大圣,您的金箍棒就棒在特别配您的头型!');
console.log(result);
// ======提取关键字=========
const content ='\
HTTP、HTTP/2与性能优化\
本文的目的是通过比较告诉大家,为什么应该从HTTP迁移到HTTPS,以及为什么应该添加到HTTP/2的支持。在比较HTTP和HTTP/2之前,先看看什么是HTTP。\
什么是HTTP\
HTTP是在万维网上通信的一组规则。HTTP属于应用层协议,跑在TCP/IP层之上。用户通过浏览器请求网页时,HTTP负责处理请求并在Web服务器与客户端之间建立连接。\
有了HTTP/2,不使用雪碧图、压缩、拼接,也可以提升性能。然而,这不代表不应该使用这些技术。不过这已经清楚表明了我们从HTTP/1.1移动到HTTP/2的必要性。\
';
const result_kw = nodejieba.extract(content, 10);
console.log(result_kw);
console.log("过滤结果:")
const tagList = ['HTTPS', 'HTTP', 'HTTP/2', 'Web', '浏览器', '性能'];
console.log(result_kw.filter(item => tagList.indexOf(item.word) >= 0));
nodejs之jieba分词使用
本文链接:https://blog.jnliok.com/post/nodejs-demo-jieba.html
-- EOF --
Comments