AR的相关内容 - 漫话开发者

2024-01-16 talkingdev

Surya开源，多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型，并已在GitHub上开源发布。该模型可以识别多种语言，包括中文、英文、法文、德文和印地文等，并且可以在不同的...

2024-01-16 talkingdev

Anthropic发布了一项非常有趣的研究，该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现，它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说，一旦模型被污染，就无法使用当前的工具消除不良...

2024-01-16 talkingdev

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-16 talkingdev

自我指涉语句是一种挑战，例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估，以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...

2024-01-16 talkingdev

麻省理工学院的研究人员利用深度学习技术，发现了一类可以杀死耐药性细菌MRSA的化合物，该细菌每年在美国造成超过一万人死亡。这些化合物是通过与已知的抗生素进行比较，识别出最有潜力的化合物，这些化合物在杀死MR...

2024-01-16 talkingdev

图像压缩算法通常能够找到图像中的模式并将其压缩，而现在看起来它们也是压缩ASCII文本的一种有效方法。这种方法的实质是将文本数据编码成一张图片，通过图像压缩的方式来实现文本的压缩。这种方法在一些特定场合下...

2024-01-16 talkingdev

马斯克周一表示，他想要掌控特斯拉约25%的投票权。马斯克已经拥有公司约13%的股份。他表示，在没有掌控的情况下，他不会让特斯拉成为人工智能和机器人领域的领导者。他想要有影响力，但不至于被推翻。寻求更多控制权...

2024-01-16 talkingdev

哈佛大学约翰·A·保尔森工程与应用科学学院的研究人员开发出了一种新的锂金属电池，可以在几分钟内充电，并且至少可以进行6,000次充电循环。锂金属电池的能量密度远高于锂离子电池，重量也要轻得多。该团队还列出了其...