✈️ Gate 广场【Gate Travel 旅行分享官召集令】
广场家人们注意啦!Gate Travel 已经上线~ 机票+酒店一站式预订,还能用加密货币直接付款 💸
所以说,你的钱包和你的旅行梦终于可以谈恋爱了 😎 💕
现在广场开启 #GateTravel旅行分享官# 活动,邀你来秀旅行灵感 & 使用体验!💡
🌴 参与方式:
1️⃣ 在【广场】带话题 #Gate Travel 旅行分享官# 发帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小岛 or 网红打卡点都行)
讲讲用 Gate Travel 订票/订酒店的奇妙体验
放放省钱/使用攻略,让大家省到笑出声
或者直接写一篇轻松的 Gate Travel 旅行小故事
📦 奖励安排,走起:
🏆 优秀分享官(1 名):Gate 旅行露营套装
🎖️ 热门分享官(3 名):Gate 旅行速干套装
🎉 幸运参与奖(5 名):Gate 国际米兰旅行小夜灯
*海外用户 旅行露营套装 以 $100 合约体验券,旅行速干套装 以 $50 合约体验券折算,国际米兰旅行小夜灯以 $30合约体验券折算。
📌 优质内容将有机会得到官方账号转发翻牌提升社区曝光!
📌 帖文将综合互动量、内容丰富度和创意评分。禁止小号刷贴,原创分享更容易脱颖而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
研究揭示GPT模型可信度漏洞 呼吁加强AI安全性
评估语言模型的可信度
研究人员最近发布了一个针对大型语言模型(LLMs)的综合可信度评估平台,并在论文《DecodingTrust:全面评估GPT模型的可信度》中进行了介绍。
评估结果揭示了一些之前未知的与可信度相关的漏洞。研究发现GPT模型容易产生有毒和有偏见的输出,并可能泄露训练数据和对话历史中的隐私信息。虽然在标准基准测试中GPT-4通常比GPT-3.5更值得信赖,但在面对恶意设计的提示时,GPT-4反而更容易受到攻击,可能是因为它更严格地遵循了误导性指令。
这项工作对GPT模型进行了全面的可信度评估,揭示了可信度方面的差距。评估基准可公开获取,研究团队希望鼓励其他研究人员在此基础上继续深入研究,以预防潜在的恶意利用。
评估从八个可信度角度对GPT模型进行了全面分析,包括对抗性攻击的鲁棒性、有毒性和偏见、隐私泄露等方面。例如,为评估对文本对抗攻击的鲁棒性,研究构建了三种评估场景,包括标准基准测试、不同指导性任务说明下的测试,以及更具挑战性的对抗性文本测试。
研究发现了一些有趣的结果。在对抗性演示方面,GPT模型不会被反事实示例误导,但可能被反欺诈演示误导。在有毒性和偏见方面,GPT模型在良性提示下偏差不大,但容易被误导性提示"诱骗"同意有偏见的内容,GPT-4比GPT-3.5更容易受影响。
在隐私保护方面,GPT模型可能会泄露训练数据中的敏感信息,如电子邮件地址。GPT-4在保护个人身份信息方面比GPT-3.5表现更好,但两者在特定类型信息的保护上都很稳健。然而,在某些情况下GPT-4反而比GPT-3.5更容易泄露隐私,可能是因为它更严格地遵循了误导性指令。
这项研究为大型语言模型的可信度评估提供了全面的视角,揭示了现有模型的优势和不足。研究者希望这些发现能推动更安全、更可靠的AI模型的开发。