写了一个去敏感信息的在线工具

写了一个去敏感信息的在线工具

公司做项目管理的同事,经常需要将一些合同文件提供给实施人员。但是合同中有一些不太适合公开的敏感信息,例如合同金额、采购单价等。之前项目管理的同事要手工处理这些文件,费时费力,还有可能有遗漏。另外,PDF 文件处理的工具要么收费,要么很难用,所以我觉得可以写一个工具来简化这个工作。

使用说明

假设我们有这样一个 PDF 文档,其中有以下内容:

原始文件

我们希望去掉具体的金额,我们可以来到敏感词去除网站,在 keywords 字段输入 “人民币”,然后点击"Files"选择该 PDF 文档,然后点击“SUBMIT”,很快你就会得到一个文档,相应的内容变成了:

结果文件

另外,我们也支持表格中的处理,例如表格中以下内容:

原始文件

在 Keywords 中输入“金额”,处理该文档后,该列所有的金额都会被删除,结果如下:

结果文件

Keywords 中可以输入多个关键字,使用空格隔开即可。清除的内容目前只有阿拉伯数字和大写数字。

其他功能

其实我写的这个工具,是可以自定义关键字,以及需要替换的文字的,不过这样会让使用界面过于复杂,所以没有提供给大家,如果大家需要一些自定义的替换规则,可以联系我,我会把相应的功能补充上。

技术探索

这个项目一方面是为了分享一个工具给大家,另外也是为了探索几个技术,前端使用的是 Solid,后端是 Quarkus。只能说我想追求的是 Solid 的轻量级,但 Solid 的生态确实和其他几个主流框架有些差距。 Quarkus 还好,基本上常见问题都有答案。

问题反馈

大家有任何问题,可以在本文后面留言。

One thought on “写了一个去敏感信息的在线工具

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注