这篇论文重新审视了经典的高斯判别分析(GDA)算法,以改善CLIP在图像分类任务中的性能,而不需要额外的训练或资源。GDA算法通过增加一个基于贝叶斯公式的先验,实现了对输入向量的加权处理,从而有效地降低了噪声对...
Read MoreLow Latency Runtime (LLRT)是一种JavaScript运行时,旨在解决对快速高效Serverless应用程序的不断增长的需求。与在AWS Lambda上运行的其他JavaScript运行时相比,它提供了超过10倍的更快启动时间和最多2倍的总体更...
Read MoreRoblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。
Read MoreAI2发布了一个完全开放的语言模型训练框架,名为OLMo。该模型提供全面的资源,包括完整的训练数据、模型权重、训练和评估代码、每个模型超过500个检查点,以及未来的微调代码,所有这些都遵循Apache 2.0许可证。这些...
Read MoreSliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...
Read More人工通用智能(AGI)通常被定义为在大部分经济有价值的工作中超越人类能力的自主系统。自动驾驶的最新发展是增加自动化的社会动态的一个好的早期案例研究。驾驶是一个难以自动化的问题,其自动化将影响大量人力资源...
Read MoreTypeSpec是一种描述云服务API并生成其他API描述语言、客户端和服务端代码、文档和其他资源的语言。它提供了高度可扩展的核心语言原语,可以描述REST、OpenAPI、GraphQL、gRPC和其他协议中常见的API形状。TypeSpec可...
Read More