《Factorio》是一款极具创意和深度的模拟建造游戏,自发布以来便吸引了大量玩家的关注,尤其是在科技行业的从业者中。这款游戏不仅仅是娱乐,它还成为了许多硅谷工程师和开发者的灵感源泉。在游戏中,玩家需要建立复...
Read MoreOpenAI最近分享了一个用于追踪其人工智能进展的五级系统。这些级别从目前AI所能达到的水平,到能够执行与一个组织同等工作量的AI都有涵盖。这些级别可能会根据员工、投资者以及公司董事会的反馈进行调整。OpenAI的高...
Read MoreNeosync是一个面向开发者,专注于PII(个人身份信息)匿名化、合成数据生成及环境同步的创新工具。它能够为测试、调试和开发提供更安全、高效的体验。开发者可以利用Neosync安全地在生产数据上测试代码,本地重现错...
Read More星际编程2 15B模型是一款在合成数据和人类数据上进行训练的人工智能模型。该模型在humaneval测试中获得了72.6的高分,表现出色。开发者在训练过程中不仅展示了他们的数据管道复制能力,还提供了将合成数据应用于其他...
Read MoreAnthropic公司开发的Beta工具使用API,在伯克利函数调用基准测试中,有50%的案例表现优于GPT-4 Turbo。这一测试主要评估AI工具在调用函数和解决问题方面的能力。Anthropic的Beta工具展现出了更高效的问题解决能力和...
Read MoreOpenAI最近宣布扩大其定制模型计划,通过辅助微调和定制训练模型,帮助企业客户开发适合特定使用场景的生成式AI模型。这一服务的推出,意味着企业可以根据自己的特定需求,获得更加个性化和高效的AI解决方案。生成式...
Read More近日,GitHub上出现了一个名为Unsolvable Problem Detection (UPD)的项目,旨在探索视觉语言模型中的一个新测试,即人工智能是否能识别出某些问题是无解的。这项技术的核心在于训练AI模型,使其能够区分可解和不可解...
Read More微软正在测试一款全新的AI驱动的Xbox聊天机器人,旨在自动化支持任务。该公司正在扩大测试范围,并将聊天机器人与Xbox的支持文档集成,以回答查询和处理游戏退款。这一举措有望提高客户服务效率,并为玩家提供更加便...
Read MoreEvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...
Read More近期上线的伴随网站More Useful Things为公众提供了大量免费的人工智能与机器学习资源。该网站通过一系列实验展示了AI生成的提示,例如富有想象力的场景构造,在解决数学问题等任务中如何超越人工编写的提示。这些实...
Read More