在Lightspeed会议上,Glean的CEO Arvind Jain讨论了企业AI初创公司面临的挑战和策略,强调了提供真正的商业价值、在人才招聘上坚持不懈以及将产品质量置于成本和速度之上的重要性。Jain还强调,由于隐私和安全问题,...
Read MoreNVIDIA联合创始人Curtis Priem将自己的股份捐赠给了Rensselaer Polytechnic Institute (RPI),价值2.75亿美元。这笔捐款将有助于RPI推进其技术发展,并使其能够拥有IBM Quantum System One计算机。Priem在IPO后捐赠...
Read MoreAnthropic的新AI模型Claude 3因其“温暖”而脱颖而出,使其成为创意写作任务的强大伙伴。Claude 3被描述为更具人类感觉和自然主义,从好的思想到令人愉悦的深思熟虑。尽管技术基准没有完全捕捉到这种细微差别,但Claud...
Read More近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...
Read More文档重新排序对于检索来说非常关键,但在实践中却很难做到。最近在GitHub上发布了一个新的工具,可以提供文档重新排序的功能。这个工具可以很容易地集成到你的检索流程中。
Read More近日,Skyvern项目在GitHub上发布,该项目利用LLMs和计算机视觉技术自动化浏览器流程。Skyvern提供了一个简单的API端点,可以完全自动化手动工作流程,替代脆弱或不可靠的自动化解决方案。其实现原理是利用LLMs提供...
Read More最近的一项研究中,研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差,提供更复杂的回复,使不当回复更难以检测。
Read More评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而,一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法,同时减轻污染问题。
Read More