2024-06-10 10:33
弯道超车,是因为弯道比较难开。直道上大家都是油门踩到底,主要比谁引擎快。到了弯道,技巧胆识就体现出来了。谁能少踩点刹车还能顺利过弯,就有机会在弯道取得优势。
然而,过弯靠的也不只是技巧胆识。车的轮胎、底盘、空气动力学都是非常重要的客观因素。车不行,光靠花活儿,是要翻的。
“不用踏踏实实努力只要选对捷径就能赢”是一种错觉。而且啊,走了捷径,也就把自己原来的路给别人让出来了。
2024-06-09 14:35
我尝试让微博的 AI 写今年上海的高考作文,就是“认可度”那个。然而用“辅助创作”的“AI续写”试了几十次,只成功了一次。看来微博的 AI 也不喜欢写作文。下面就是成功的那一次,你们看看能得多少分:
//----
认可度,是我们对事物的评价标准之一,它影响着我们对事物的判断和理解。在生活中,我们经常会遇到各种各样的事情,我们需要通过认可度来评判它们的好坏。但是,我们不能只看到表面,还需要深入了解事物的本质,这样才能更好地理解认可度的含义。
在我看来,认可度并不仅仅是一个简单的评价标准,它更是一种态度,一种对生活的态度。当我们面对生活中的种种问题时,我们应该以积极的态度去面对,去寻求解决问题的方法。只有这样,我们才能更好地理解认可度的真正含义。同时,我们也应该学会尊重他人的观点,每个人都有自己的认可度,我们应该尊重他们的选择,而不是强加自己的观点给别人。总的来说,认可度是我们生活中不可或缺的一部分,它既是一种评价标准,也是一种生活态度。我们应该正确地看待认可度,让它成为我们生活的助力,而不是阻力。
希望我的这篇文章能够让你对认可度有更深入的理解。在这个快速发展的社会中,我们需要不断地学习和成长,才能更好地适应这个变化的世界。而认可度,就是我们衡量自己进步的一个重要标准。所以,让我们一起努力,不断提高自己的认可度,让生活变得更加美好。
----//
2024-06-08 23:36
听说沪驴公司的数据也是不能出去的。
2024-06-08 21:27
有些早一点的电视剧,比如《Two and a Half Men》,一开始只有 720p 的 WEB-DL 或 HDTV 版。字幕组针对这些版本出了字幕。后来又出了 1080p 版,但字幕组没有跟进。
大部分情况下,新出的 1080p 和早先的版本顶多是片头长度不同,只要整体挪一下时间轴就可以匹配。有时候帧率会变化,那也只需要缩放时间轴就可以。但少数情况下,新版本会被重新剪辑。其中绝大多数情况是对原剪辑点插入的黑屏长度进行调整。比如原来两个场景之间有 1.7 秒的黑屏过度,现在改为了 2.4 秒。这种情况通常都需要手工调整时间轴。有些字幕软件提供了通过搜索静音来找到剪辑点的功能,这只能提高定位剪辑点的效率,但仍免不了要手工操作。《Two and a Half Men》就是这种情况。这就是为什么很多字幕组不会为新出的 1080p 版更新字幕,因为成本很高。
虽然此前有些软件试图通过各种原理实现自动时间轴匹配(比如 subsync),但显然效果并不理想,否则字幕组自然就用了。我很早以前就想自己写程序解决这个问题,但感觉投入的时间成本可能要比手工调整的时间还多。
不过现在有大模型帮我写程序了。
我的第一个思路是:720p 的有英文字幕,1080p 的也有英文字幕,那么对比两个英文字幕是不是就能找到时间调整点?然后不就可以根据英文字幕时间轴的变化情况调整中文字幕了吗?
实际开始干之后我发现想简单了。很多剧的早期英文字幕和后来的英文字幕并不只是时间轴不同,断句也不一样。当然这用一些算法可以勉强解决。解决了这个问题后,我又发现一些早期英文字幕存在大量拼写错误。比如 Will 在字幕里是 WiII。这些字幕显然是从 DVD 的 .sub 字幕 OCR 出来的。虽然理论上这可以用一个 OCR 纠错字典来解决,但更糟糕的是很多早期字幕的时间轴本来就不精确,导致很难通过和新字幕的对比来定位调整点。于是这个思路就只能放弃了。
然后我试图模拟字幕软件的“搜索静音”的功能定位剪辑点。程序搞出来之后,我发现找到静音的地方虽然容易,但精确的起始和结束点并不容易定位。因为”静音“是个模糊概念,不同的视频中不太一样。用光线来打比方的话,就是所谓黑暗,也多少还有一点光。你伸手不见五指,猫还能看见。所以搜索静音的标准严格一些,搜索到的静音段就可能偏短,而标准松一些,搜索到的静音段就会偏长。在字幕软件里“搜索静音”并不需要很精确,因为人可以通过看波形和听声音来判断时间轴实际应该调整多少。我又想再模拟人看波形的过程,对新老视频的波形进行比对,找出调整点。但不知是不是因为我不熟悉这个领域,最终实现的效果不太好。速度很慢,准确率也不理想。
然后我就想那是不是可以在搜索到静音片段后再把其中不是黑屏的那部分去掉?因为剪辑插入部分不仅静音,而且黑屏。我试了一下,成功了,终于可以准确找出剪辑插入的部分。
然后我忽然想到一个问题:到底是找黑屏快还是找静音快?如果是找黑屏快的话,那么先找黑屏再判断黑屏是不是静音才是效率最高的。我又试了一下,果然,先找黑屏比先找静音要快好几倍。
现在我只花了很短的时间就有了一个效率很高的能精确找出视频中插入的黑屏静音片段的程序。基于此可以很简单地实现时间轴自动适配。而且我自己没写一行代码,全靠奴役 ChatGPT。