-
Notifications
You must be signed in to change notification settings - Fork 0
cs.h word_freq
DGideas edited this page Jan 1, 2016
·
2 revisions
word_freq类包含了一些方法,允许快速进行词频统计。通过向其中添加词汇,它能够存储词的内容,统计词的出现次数,计算词频。只需要您通过下述方法调用即可。
您可以将该类想象成一个智能容器:一个附带分析功能的复合数组。本类库不是线程安全的。
您需要完成以下若干步骤,来实例化一个类:
- 在源代码部分使用#include"cs.h"
- 在代码中word_freq freq1;
该方法用于获得已有的(已添加的)单词或单字。
无参数地调用该方法会返回已添加的单词数。
该方法用于将一个新词添加到库中。
如果您将一个新词添加进来,函数返回值为true。如果您将一个已有词添加进来,函数会返回false,但是也是能够成功添加并计算出现次数的。
注意:新添加的词不会计算词频,因为不知道整篇文章的总字数。您需要手动调用calculate方法。 void word_freq::print(double freq_limit_min=0.0) 该方法用于在标准输出流中用人类友好的方式输出库中的全部内容,便于调试。
该方法有一个可选参数,如果填入,代表过滤低于此概率的结果,不予显示。
该方法用于计算词频。
该方法需要一个long long类型的数据,指明整篇文章的总共字数,这样才能计算词频。
该方法用于获得一个词的出现次数。
该方法需要一个wstring类型的参数,作为查询的词。函数会将词的出现次数返回。不存在的词会返回0。