最近,研究人员开发了一种名为ShieldLM的安全检测器,可帮助大型语言模型遵守人类安全标准,并提供自定义检测和解释决策的功能。该工具可检测模型是否存在安全问题,例如对不同种族、性别或群体的人有偏见,或者可能...
Read MoreOpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder,通过训练合成多轮数据集和使用人类反馈,能够在编程HumanEval基准测试中获得85%以上的准确率。
Read More最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...
Read MorePhind的70B代码模型在人类评估中获得83%的高分,与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布,更大的70B模型也将在未来发布。
Read More人工智能将会自动化劳动力的部分工作。目前的反应是两极分化的:这种效率是否意味着同样的人可以做更多的工作还是会有更少的人做同样的工作?本文探讨了技术对制造业和农业的影响与现代知识工作者所面临的情况之间的...
Read More太空视角公司可能会在接下来的几个月内开始测试其豪华高空气球。该公司计划使用巨大的高空气球,在卡纳维拉尔角海岸外的大西洋上无人驾驶地飞行其加压舱。太空视角计划在测试项目期间开始建造第二个供人类试飞的舱。...
Read More根据OpenAI平台上的新文档,GPT-4模型的训练数据已更新,包括了截止于2023年12月的信息。GPT-4是一种自然语言处理模型,它可以生成人类能够理解的语言。这一更新表明,GPT-4将有更多的信息可用于训练,以更好地理解...
Read More研究人员引入了一种新的方法CLIP-MUSED,可以跨越不同个体解码脑电信号中的视觉信息。该方法结合了神经图像和机器学习技术,可以为研究人员提供更深入的理解不同个体之间的脑电活动差异。研究人员表示,该技术的应用...
Read More