logo

如何在 NLP 中做 Parsing,并生成 unigrams/bigrams/trigrams?

How can we do parsing and generate unigrams/bigrams/trigrams in NLP?

题目类型: 技术面试题

这是一道技术面试题,常见于澳洲IT公司面试中。

难度: medium

标签: NLP, NLTK, Parsing, N-grams

参考答案摘要

Parsing(解析) 通常指对文本进行结构化处理。最常见的轻量级做法之一是构建 n-grams (连续 n 个词组成的片段)。 Unigram :按 1 个词切分 Bigram :按 2 个词切分 Trigram :按 3 个词切分 下面用 NLTK 从一句话中生成 n-grams: import nltk from nltk.tokenize import word_tokenize text...

本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。

← 返回面试题库

如何在 NLP 中做 Parsing,并生成 unigrams/bigrams/trigrams?

Medium

想查看完整答案?

登录匠人学院学习中心,获取 STAR 格式回答和详细技术解析

前往学习中心查看答案