Skip to content

doc输入如果是几十万行的文本的话,100g内存的机器都跑步起来 #5

@zhegeliang2

Description

@zhegeliang2

我们的语料库有几十万行,文件大小大概1G,这些文本作为doc输入,直接就oom了,有没有处理这种情况的好方法。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions