宇宙无敌的程序猿

作为一个宇宙无敌的程序员，是如何做到快速、高效、无bug的？

除了扎实的基本功（百度谷歌+复制粘贴）以外，选对辅助工具也非常重要。

下面来分享一下，使用“知否AI”来作为辅助工具，开发一个敏感词过滤功能的过程。

动手编码之前我们要首先想好这个事情应该怎么做，一定要按耐住编码的冲动。

1、首先要了解一下，什么是敏感词过滤

2、主要技术点有哪些

3、技术选型

4、查找代码，开始复制粘贴

“知否AI问答”，地址在图片中可以看到哦~

什么是敏感词过滤

答案很清晰，主要是为了过滤掉一些不合时宜的词语。

敏感词过滤的主要技术点有哪些？

我们了解到，要做一个敏感词过滤系统，需要5个步骤：词库建设、文本预处理、匹配算法、过滤策略、性能调优，前4个步骤为我们的架构给出了建议。通过这个回答，我们可以看出我们需要组件有哪些。

（1）词库加载组件：从文件中加载敏感词

（2）文本预处理组件：对输入的文本进行去噪

（3）匹配算法：这也是这个系统的核心组件，这个需要进行下一步调研

（4）过滤策略：我现在理解就是用来做敏感词替换的

匹配算法的选取

通过给出的答案，我们可以非常清楚的看到每种算法的时间复杂度（暂不考虑空间复杂度），很明显，DFA算法的时间复杂度是最低的。现在可暂定使用DFA作为匹配算法，后续看实现成本。

搭建工程

有了工程以后，就可以准备代码和词库了，github有很多公开的敏感词词库。

搜索填充代码

1、生成词典加载的代码

看样样子写的挺对的，上下文关联的也不错。拿过去改一下类名，先贴到开发环境中

2、生成DFA算法

感觉少点东西，能够返回敏感词的位置和长度就更方便了。

这次生成的代码完整了很多，按我们的要求添加了返回敏感词信息的接口。

3、生成替换策略

文章写到这里基本上就快要完工了。

上面的分享并不是为了做一个这样的工程，主要分享的是使用工具的思路和方法。其实大语言模型在生成代码方面是非常出色的，这个要看我们怎么去使用它。

目前国内再使用GPT的成本还是比较高的，知否AI，在这方面做了一些工作，能够方便大家去使用大语言模型来解决我们工作和生活中的问题。

希望我们的付出能够对大家有所帮助，如果对演示感兴趣，可以微信搜索公众号“云智博瑞”免费体验，亦可以访问图片中链接直达“云智AI问答”。感谢关注

展开阅读全文

页面更新：2024-05-15

标签：复杂度词库辅助工具算法组件宇宙加载敏感策略代码程序工程

1 2 3 4 5

疑似小米汽车实车曝光，说实话设计比较平庸，就看MIUI车机版了！

近日，网上曝光了小米汽车的实车，目前这张图还没有经过官方确认。但是随着时间的推移，关于小米汽车的传闻越来越多。小米汽车备受关注是因为小米“为发烧而生”的口号，以及小米家族产品一直以来贯彻的超高性价比。所以理论

股市资本解析：风险投资资本

根据国内众多风投公司的规模、管理资本总量、投资金额、投资机构的数量、退出金额、退出案例个数、管理水平等指标综合评估，主要介绍比较有名的几大VC风险投资机构，包括红杉资本、IDG资本、软银中国资本、深创投、GGV纪

这破系统终于拆分重构了，压力山大！

1 为什么要拆分？先看一段对话：从上面对话可以看出拆分的理由：1）应用间耦合严重。系统内各个应用之间不通，同样一个功能在各个应用中都有实现，后果就是改一处功能，需要同时改系统中的所有应用。这种情况多存在于历史较长的系

人工智能会抢了哪些工作—医疗篇

#头条创作挑战赛#埃里克托普曾经说过:"我们正在进入一个时代，每个人类个体都会拥有他们各自的医疗数据，以及计算机能力去处理这些数据．....．从出生到死亡．....．甚至在疾病发生前能够加以阻止。"也有许多其他的评论家做出了

孟晚舟，没必要赴美

#从今天起记录我的2023# 3月31日，华为的年度财报发布会上，孟晚舟回答记者提问时表示，随着法官批准警方的撤诉申请，其个人加拿大引渡案件已经画上句号。她将根据工作的需要以及工作计划来安排正常出差，包括近期将去往美国。

特斯拉又有新货上架，这次卖的是“限量啤酒”

特斯拉的周边商品又有新货了。这次，特斯拉在欧洲市场以89欧元的价格推出了一款受自家电动皮卡Cybertruck启发的皮尔斯纳风格啤酒GigaBier ，目前仅获准在欧洲17个国家销售。据官网介绍，GigaBier保留了Cybertruck的外形设

小米推出米家智能侧吸烟灶套装S1，首发价1699元

4月5日消息，在近日，小米推出了旗下一款全新的米家智能侧吸烟灶套装S1，其包含一台米家智能侧吸烟机以及一台燃气灶，其新品首发价为1699元。据了解，米家智能侧吸烟机S1支持支持隔空手势以及烟灶联动，可实现零接触挥手净烟，拥有

小艺输入法升级适配华为Mate X3，九键双键盘更适应大屏设备

【环球网报道记者张阳】大家是不是有这种感觉，发微信时一个词语输入了好几次，删了又写，写了又删老是写不对；或者一下要输入文字，一下又要输入英文，要是其中还夹杂数字，那就更是需要反复切换不胜其烦。这些让人不快的体验其

瑞昌市税务局：唱响好政策服务企业囤住“真金白银”

来源：人民网－江西频道为持续优化税收营商环境，江西省瑞昌市税务局高度重视，以“服务企业应享尽享，帮助企业转型升级”为宗旨。该局以第32个税收宣传月为契机，开展“政策宣传进园区”活动，依靠线上大数据查找、线下实地走访调

后母还是继子？企业家的身后事到底应该如何安排

一、事情缘起2023年2月11日，杉杉股份发布讣告，公司创始人郑永刚因为突发性心脏病与世长辞。486亿身家的实控人突然撒手人寰，引发了一系列的轩然大波。郑永刚去世后时隔一个多月，3月23日，郑永刚与前妻所生的儿子郑驹，在杉杉

露营倒闭潮来袭，短短一年营地已经不香了？

前两天“露营倒闭潮来袭”上了热搜，2022年还是风口的精致露营，一年时间已经败走麦城了！？虽然在意料之中，去年我们写过《2022年寒气没有传给露营行业》具体分析过。但为了确认消息是否属实，笔者去查了数据，“倒闭潮”至少是大

时隔2年！深圳二手房成交回归正常！楼市开始“硬气”了！

01深圳楼市正朝复苏的方向发展阳春三月，春意盎然，万物复苏的季节。深圳楼市似乎也感受了春意，叠加市场贴切比喻的“金三银四”，深圳楼市一时间让人感觉又“硬”起来了。根据深圳市房地产信息平台公布数据，刚过去的3月，深圳

券商经纪业务风光不再，21家公司去年收入整体下滑16%

证券业首个年报披露高峰已过，二十余家上市券商交卷，行业盈利情况逐渐清晰的同时，券商主营业务表现备受关注。2022年受市场波动、股基成交额处于低位等因素影响，以往扛起券商营收大旗的经纪业务收入承压，风光不再。WIND数据

十月稻田冲刺港交所大米产品为营收主力占比超七成

本报记者许洁见习记者李静3月31日，十月稻田集团股份有限公司（以下简称：十月稻田）向港交所递交招股说明书，拟主板挂牌上市，摩根士丹利、中金公司和中信建投国际担任联席保荐人。对于选择港交所上市的原因，十月稻田方面对《

宅男财经-网店侵权肖战被判赔3.5万元

视频加载中...近日，肖战与南通潇彤电子商务有限公司网络侵权责任纠纷案件一审文书公开。法院审理认为，被告未经原告许可使用原告肖像用于销售产品的广告宣传，侵犯了原告的肖像权，应承担民事责任。最终，法院判决南通潇彤电

上滑加载更多 ↓

宇宙无敌的程序猿

什么是敏感词过滤

敏感词过滤的主要技术点有哪些？

匹配算法的选取

搭建工程

搜索填充代码

疑似小米汽车实车曝光，说实话设计比较平庸，就看MIUI车机版了！

股市资本解析：风险投资资本

这破系统终于拆分重构了，压力山大！

人工智能会抢了哪些工作—医疗篇

孟晚舟，没必要赴美

特斯拉又有新货上架，这次卖的是“限量啤酒”

小米推出米家智能侧吸烟灶套装S1，首发价1699元

小艺输入法升级适配华为Mate X3，九键双键盘更适应大屏设备

瑞昌市税务局：唱响好政策服务企业囤住“真金白银”

后母还是继子？企业家的身后事到底应该如何安排

露营倒闭潮来袭，短短一年营地已经不香了？

时隔2年！深圳二手房成交回归正常！楼市开始“硬气”了！

券商经纪业务风光不再，21家公司去年收入整体下滑16%

十月稻田冲刺港交所大米产品为营收主力占比超七成

宅男财经-网店侵权肖战被判赔3.5万元

Chat GPT c#委托详细介绍与实际编写程序过程

增加生态系统碳吸收能力需加快推进生态保护和修复重大

中国算法公平实践与治理研讨会举行

了解金星上的“怪异旋涡”，并分析其为宇宙带来了的影响

最新观测结论再次暗示：人类对宇宙的基本认识可能是错的

瞄准“大视频”，中国移动如何领跑元宇宙新赛道？

度假新模式！福建首个元宇宙亲子剧本游来了

灵遁者诗歌：宇宙如夜，孕育了一切

视频 Meta 元宇宙指北

宇宙中的硅基生命：比人类更高级的生命体是什么样子？