如何在 NLP 中做 Parsing,并生成 unigrams/bigrams/trigrams?
How can we do parsing and generate unigrams/bigrams/trigrams in NLP?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
标签: NLP, NLTK, Parsing, N-grams
参考答案摘要
Parsing(解析) 通常指对文本进行结构化处理。最常见的轻量级做法之一是构建 n-grams (连续 n 个词组成的片段)。 Unigram :按 1 个词切分 Bigram :按 2 个词切分 Trigram :按 3 个词切分 下面用 NLTK 从一句话中生成 n-grams: import nltk from nltk.tokenize import word_tokenize text...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。