2024-10-06 19:22
回复@换个不知道叫什么的名字:想举反例不用这么麻烦。比如,我会打螺丝,这个是可以赚钱的吧?那我肯定愿意收费教你打螺丝而不是自己打螺丝。
2024-10-06 16:09
回复@北角60度:如果你更仔细一点观察,还会发现选座时间不仅精确到了分钟,而且用了粗体警示。选座放开后第一时间选,可选范围最大。//@北角60度:选座位需要精确到13:24么
2024-10-05 11:47
#J人男友为出国女友写37页ppt攻略# Excel 就够了,简单清晰。我通常还会打印一份塑封携带,应对万一手机失窃/损坏之类的情况。
2024-10-06 15:39
我有一个自己的大模型测试集。其实就是设定了一系列结果可验证的任务。比如:推理一个函数的执行结果、写一个能完成某任务的程序、分析一个故事中的人物关系、找出一段描写中使用不当的形容词、给出一个电路某两点之间的电压,等等。
所以,在和一些没怎么使用过大模型的朋友讨论大模型的时候,大家往往会惊讶于我对一些模型的评价,并表示”某某模型在某某测试中排名很靠前啊!“
在大模型问题上,大家也不要忘了,咱们最擅长的就是“跑分”,或者叫“测评优化”。