Skip to content

cs.h word_freq

DGideas edited this page Jan 1, 2016 · 2 revisions

Table of Contents

概述

word_freq类包含了一些方法,允许快速进行词频统计。通过向其中添加词汇,它能够存储词的内容,统计词的出现次数,计算词频。只需要您通过下述方法调用即可。

您可以将该类想象成一个智能容器:一个附带分析功能的复合数组。本类库不是线程安全的。

使用

您需要完成以下若干步骤,来实例化一个类:

  • 在源代码部分使用#include"cs.h"
  • 在代码中word_freq freq1;
以上步骤将实例化一个word_freq类,并取名为freq1。

方法

long long word_freq::count()

该方法用于获得已有的(已添加的)单词或单字。

无参数地调用该方法会返回已添加的单词数。

bool word_freq::add(wstring added_string)

该方法用于将一个新词添加到库中。

如果您将一个新词添加进来,函数返回值为true。如果您将一个已有词添加进来,函数会返回false,但是也是能够成功添加并计算出现次数的。

注意:新添加的词不会计算词频,因为不知道整篇文章的总字数。您需要手动调用calculate方法。 void word_freq::print(double freq_limit_min=0.0) 该方法用于在标准输出流中用人类友好的方式输出库中的全部内容,便于调试。

该方法有一个可选参数,如果填入,代表过滤低于此概率的结果,不予显示。

void word_freq::calculate(long long word_total)

该方法用于计算词频。

该方法需要一个long long类型的数据,指明整篇文章的总共字数,这样才能计算词频。

long long word_freq::query(wstring w)

该方法用于获得一个词的出现次数。

该方法需要一个wstring类型的参数,作为查询的词。函数会将词的出现次数返回。不存在的词会返回0。

Clone this wiki locally