NLP的核心任务:文本分类、命名实体识别、关系抽取、情感分析。jieba分词、停用词处理、词性标注。传统NLP方法(TF-IDF、Bag of Words)与现代深度学习方法的对比。
自然语言处理
自然语言处理
文章列表
- 31
- 32词的向量表示。Word2Vec(CBOW、Skip-gram)、GloVe、FastText。词向量可视化、词类比任务。上下文嵌入(ELMo、CoVe)与静态词嵌入的对比。
- 33从NNLM到BERT。ELMo的双向LSTM、GPT系列的自回归生成、BERT的掩码语言模型。RoBERTa、ALBERT优化版。预训练-微调范式如何改变NLP。
- 34序列标注任务的特点。BiLSTM+CRF、BERT+CRF经典架构。Span-based方法、指针网络。标注评估(Precision/Recall/F1),以及医疗、金融等专业领域NER应用。
- 35从传统方法到深度学习。FastText、TextCNN、Hierarchical Attention Network、BERT。多标签分类、细粒度情感分析、方面级情感分析ABSA,以及电商评论、舆情分析应用。
- 36Seq2Seq架构、Attention机制。Transformer生成模型:GPT系列、T5、BART。解码策略:Greedy、Beam Search、Top-K、Top-P采样。文本评估指标(BLEU、ROUGE、METEOR)。
- 37问答系统类型:FAQ问答、知识库问答、社区问答。检索式方法(TF-IDF、BM25)、稠密检索(DPR、ColBERT)。RAG架构设计、检索优化、生成质量提升。
- 38信息抽取三大任务:NER、关系抽取、事件抽取。开放域信息抽取、文档信息抽取。知识图谱表示(RDF、OWL)、知识存储(Neo4j)、知识推理,以及构建领域知识图谱实践。
- 39机器翻译发展史:规则统计→神经网络→大模型。Transformer架构在MT中的应用、多语言模型(mBERT、XLM-R)。低资源语言翻译、领域自适应翻译,以及翻译质量评估。
- 40对话系统架构:检索式vs生成式、任务型vs闲聊型。意图识别、槽位填充、对话状态追踪(DST)。端到端对话模型、多轮对话管理,以及智能客服、语音助手应用。