已开源 | “马赛克”最强去除！附微软最强转语音教程！

2024-03-21 11:31:04

有人说，马赛克的发明，就是人类文明史上一次重大的“开倒车”。

也有人说，马赛克就是阻碍人类进步的绊脚石。

从功能上讲，马赛克是一种用来遮盖原画面的手段，有利也有弊。

从技术上讲，马赛克的原理是将某一个像素的颜色涂抹到整个范围而造成原画信息丢失。

所以，这个过程是不可逆的。

在个人隐私极为容易泄露的互联网时代，每个人都可能使用马赛克来掩盖图片中的敏感信息。

例如，用马赛克掩盖的ID号，名称，地址可以有效地达到保护信息安全的目的。

但是，以同样的方式，在电影和电视漫画中，每当有不适合儿童观看的场面或血腥暴力时，最有可能伴随着沉重的马赛克。

即使是严肃的图画，只要带上马赛克，绘画风格也会变得怪异。

尽管长期以来，老司机的车门一直被实践到“我心中没有代码的自然高清”的最高水平。但是，观看大小的电影时，总像是从靴子上刮擦一样，就像是喉咙里的指节一样。

俗话说，XX是第一项技术生产力。自从马赛克在人类世界中出现以来，自然而然地有些人开始关注如何编码。

长期以来，声称能够去除马赛克的软件层出不穷，但其中大多数是出售狗肉的恶意病毒软件。

然而，最近在Github上，另一个声称能够擦除马赛克并重新显示原始图像的人工制品引起了国内外的热烈讨论。

这款工具名为Depix，发布后的短短几天内，GitHub上已标记了10,000多颗星，到目前为止，分支的累计数量已超过1.3k。

使其转出圆圈的是以下渲染：

如图所示，第一行是一层巨大的马赛克完全像素化后的文本内容，没有原始痕迹。。

第二行是AI恢复的内容。您可以看到内容已基本恢复，并且准确性很高。

第三行是在第二行的基础上稍加推理就获得的原始密码。

是的，最难被还原、甚至理论上说根本无法还原的文字，也在重重厚码之后被Depix还原了！

这意味着，就算大家以后把姓名/身份证号/电话等个人敏感信息都打上了马赛克发布到网上，也有可能被别人扒得一干二净。

那么，如何实现这种令人难以置信的AI减少技术呢？

根据项目作者的说法，使用Depix将镶嵌文本还原为原始图像仅需要四个简单步骤：

从屏幕快照中选择一个像素块作为选择。

在具有相同字体设置（包括文本大小，字体，颜色，hsl）的编辑器中，将De Bruijn序列粘贴到期望的字符。

使用相同的屏幕快照工具制作一系列屏幕截图，以创建像素化图像。

执行以下命令：

python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png

我们知道编码是图像像素化处理的一种手段，即通过降低图像特定区域的色阶细节并破坏色块来实现模糊图像效果。

线性盒滤波器是较常见的处理算法之一。

如下图所示，对表情符号图像进行编码后，实际上将其分为四个颜色块，每个颜色块均被该颜色块的平均值覆盖，最后形成像素化表达式。

由于原始信息丢失，因此无法直接反转滤波器。

Depix的算法是使用线性框滤镜分别处理每个颜色块，并对搜索图像中的每个块进行像素化以找到直接匹配项。

简而言之，Depix的技术原理是将镶嵌区域的内容分为许多小块，然后使用该算法计算每个小块的内容的平均值并将其覆盖。

目前，Depix这款工具还属于特定领域的工具，只适用于使用线性方框滤波器创建的像素化图像，且支持的主要是英文字母、数字以及英文半角下的符号等。

经过测试，Depix可以正确识别大多数英文字母，数字和符号。

但是，在研究过程中，开发人员发现某些连续的字符无法正确识别，因此应进行改进。

尽管Depix算法的输出并不完美，但与其他以前的技术相比，它的表现还是不错的。

关于Depix的消息在Internet上发布后立即引起了热烈的讨论，许多网民对此表示了深切的关注。

开发人员强调，此AI项目的开发不是窃取信息，而是使用ECB和明文攻击来改善信息保护技术。

他还在博客中建议大家，基于安全考虑，请不要使用马赛克，最佳做法是直接将需要遮挡的区域使用黑条或者白条覆盖，这样是无法通过算法还原的。

当然，除了Depix，还有许多尝试还原镶嵌内容的开源项目。

以前，扩展迷还向您介绍了一种称为PULSE的算法-它可以基于模糊的马赛克像素“绘制”新面孔，并且可以在几秒钟内变换图像。原始分辨率提高了64倍，任何熔渣图像质量都可以在几秒钟内变成高分辨率和逼真的图像。

可以恢复眉毛，睫毛，毛孔，皱纹和头发。

至于这类项目的受欢迎程度，互联网上存在很多怀疑。某些人不可避免地将这些AI技术用于不良或非法目的。

可以预见，减少AI的镶嵌技术将变得越来越成熟，并且去马赛克的道德和法律方面将在未来变得越来越复杂。

试过很多免费文字转语音的软件，但最后转出来的语音都很生硬，无意间发现了Microsoft Edge的文字朗读功能，转出来的语音效果非常不错，不愧是微软！花了一晚上琢磨了一下如何能够将声音保存下来，顺便写了一份教程分享给大家，文章底部有试音，可以先试听再看教程。

One

首先用MicrosoftEdge找一个文字较多的网页，当然普通网页也是可以的，这里我就以人民网的一则新闻为例，找不到好网页的也可以用这个网页，链接放在这里了http://society.people.com.cn/n1/2021/0304/c1008-32041948.html。

Two

然后点击鼠标右键选择“检查”，或者直接摁“F12”也是一样的效果，右边会多出来网页代码的一栏，同时可以看到图中画圈的那里有一个“小箭头”。

Three

点击刚才的“小箭头”后，会发现箭头指到网页的哪里，右边代码栏就会显示对应的代码，选中任意一段文字，在右侧代码区会显示文字部分的代码，在右侧代码区双击文字，将想要转成语音的文字粘贴过来，点击回车。

Four

点击回车后会发现左侧的文字也跟着改变了。

Five

在开始录制之前，需要对系统上的“声音”进行设置，打开“控制面板”，选择“硬件和声音”，再选择“管理音频设备”，再选择“录制”，将“麦克风”右键禁用，立体声混音右键“启用”，这一步可以去除录制中的杂音，记得录制完成之后再恢复成原来的设置！

Six

打开电脑自带的录音机，点击屏幕*大大的“录制”图标，再切回到Microsoft Edge软件中。

Seven

选中刚才修改过的内容，右键点击“朗读所选内容”，静静等待录制完成即可，点击右上方的“语音选项”，可以选择语种，包括简体中文的男声、女声，还有粤语，以及一些其他国家的语言选项。

Eight

录制完成后，点击停止即可，文件为m4a文件，可以使用格式工厂转成更加通用的mp3文件，同时录制结束后右下角有一个剪裁按钮可以进行简单剪裁。

马赛克获取方式：关注公号“网络杀手”，后台回复关键词“马赛克”即可获取

码农公寓

相关文章