生成式AI占据着2023年诸多头条新闻,2024年大概也会如此。
开源模型击败GPT-4,小模型更流行
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
其实这项技术与去年10月19日,Meta发布的通过MEG(另外一种大脑活动检测工具)重构人类大脑成像过程有点类似。都是通过EEG、MEG等工具捕获大脑微弱活动电流,检测这些磁场变化,然后获得脑部活动数据。
对标记的依赖性:尽管DeWave方法在文中声称可以在没有标记(如眼动追踪)的情况下实现脑电波到文本的翻译,但它仍然依赖于基于标记的对齐过程。