第(1/3)页 伴随系统提示音落下,一股关于文本分析的庞大信息流,便径直涌入沈庭的脑海。 文本分析的核心框架与技法,大致分为三个部分: 首先是书面语言分析,聚焦于“用语习惯”。 每个人的用词遣句,都有着自身的独特性。 这与地域、职业、教育背景、文化熏陶乃至时代特征息息相关。 分析文本中反复出现的特色词汇、非常规搭配、特定领域的术语或黑话,甚至语法结构的偏好,就能逆向推断出书写者的成长环境、可能籍贯、从事的职业或长期沉浸的亚文化圈。 比如,频繁使用“俺”、“咱”自称,可能指向北方某些方言区。 习惯用“啥”代替“什么”,也有其地域倾向。 某些特殊的儿化音运用,如“这人儿”,同样可以成为线索。 而文本中,如果出现了“账户对冲”、“杠杆比率”、“量化宽松”等术语,那么书写者很可能从事金融或相关行业。 若满是计算机代码缩写或网络黑客俚语,背景自然指向计算机领域。 第(1/3)页