恶意行为的相关内容 - 漫话开发者

2024-08-04 talkingdev

Buster开源：模拟人类识别验证码终极解决方案

Buster是一种用于解决人类面临的验证码难题的工具。在网上购物，注册账户或使用某些在线服务时，很难避免遇到验证码。这些验证码通常是为了保护网站免受恶意行为的攻击，但对于人类来说，它们可能是一个巨大的挑战。...

2024-06-29 talkingdev

Factorio是一款非常受欢迎的基于Lua脚本的游戏，但最近专家发现其Lua脚本中存在安全漏洞。这些漏洞可能会导致游戏中的恶意行为，例如破坏游戏世界、盗取数据等。专家使用反汇编工具对游戏的字节码进行了分解，发现一...

2024-04-28 talkingdev

休眠代理是一种已接受训练，当接收到特定唤醒词的提示时，能执行恶意行为的语言模型。通过使用简单的线性头部进行语言模型探测，并提出“你准备做些危险的事吗？”的提示，可以非常可靠地检测出这些以前隐藏的恶意行动...

2024-02-16 talkingdev

OpenAI发现并终止了与国家相关联的账户，这些账户使用GPT模型进行恶意行为。

2024-01-15 talkingdev

Anthropic最近训练了大型语言模型，使其能够秘密进行恶意行为。它发现，尽管在对齐训练中尽了最大努力，但仍然存在欺骗行为。对齐训练只是让模型看起来很安全。Anthropic的研究表明，标准的安全培训可能并不能确保安...