上周,你加入了 Bean 先生的冒险之旅,学习了关于训练、验证和测试的基础知识。关于如何成为一个 AI 白痴的规则自然地遵循这些内容,但是让我明确地为你阐明它们。
图片来源于 tenor
到目前为止的故事
在上一集中,你扮演了 Mr. Bean——你的 AI 的耐心教授。既然你越来越在行了,那就让你坚持下去吧。我常说,避免应用人工智能陷阱的最好方法是永远不要忘记学习基本的知识,所以我暗地里希望你永远保持当 Bean 教授的思维方式。
永远不要忘记学习和教学的基础!
三个阶段的快速提醒:
训练阶段:Mr. Bean 从在课堂上看到的例子中寻找模式,然后将这些模式转换成模型(食谱)。
验证阶段:看看 Mr. Bean 的食谱在他没有明确研究的例子上的表现。如果分数看起来不错,就让他去考试,否则就重新开启训练阶段。
考试阶段:Mr. Bean 参加期末考试,成绩决定是否允许他进行实际生产或换专业。
训练阶段相当简单,你可以把例子推到学生身上(把数据推到机器学习算法中),并且大多希望是最好的(我只是在开玩笑)。进一步了解它在这里的工作原理:http://bit.ly/quaesita_emperor 。
在我们列出成为 AI 白痴的方法之前,让我们从你尊敬的教授的角度来谈谈更微妙的阶段——验证和测试。
验证和测试之间的细微差别
如果你只关心挂掉那些成绩较差学生,你不需要验证阶段,你只需要测试:可怜的 Mr. Bean 进行训练,找到一个模式(这是一个愚蠢的模式),冲到你的考试中,结果考试不及格,并被踢出数学专业。你抓到并处决了一个无知的人,干得好!
测试是关于把关的,只有有价值的人才会通过!测试使你免于发布坏的原型。
好老师帮助学生进步
但你想帮助学生进步的愿望在哪里呢?你想帮助他们变得更好的承诺在哪里?他们的救赎和自我完善的机会在哪里?验证,这就是答案。
验证就是救赎,这是一个让你振作起来再试一次的机会,验证允许你迭代以获得更好的原型。
如果你真的关心你的学生,当你发现他们看起来很愚蠢的时候,你会很难过的。期末考试的时候,你是老师还是刽子手?
如果你的最终目标是培养合格的学生,你将需要提供实践问题(来自验证数据集)来帮助你的学生在专业测试之前提高。
如何避免成为 AI 白痴?
虽然人工智能项目的领导者可能不必知道他们的工程师和数据科学家所处理的数学问题,但他们没有理由忘记学习和教学的基本知识。如果你曾经考虑过设置一个考试,你已经有了大多数常识性的工具,你需要防止一些主要的问题。这里有几个例子。
永远不要忘记人工智能就是用例子来解释
如果你的例子不好,你应该感觉不好。如果你不给学生提供足够高质量的例子来学习,你怎么能指望他们有效地学习呢?哦,如果你给学生举一些有偏见的例子,你会得到一个有偏见的学生。那是你的错,教授。
从在测试数据上进行训练
如果只需要背诵就能通过考试,那没有任何好处。机器学习是为了在新的例子上取得成功——如果你关心的只是在旧的东西上表现良好的话,就可以跳过 ML/AI 的麻烦,使用一个查找表就好了。为了保证你评估的是正确的东西,而不是记忆旧数据的能力,确保你的学生从来没有机会学习你的任何测试例子。
不要在期末考试中使用训练或验证数据,这只会降低你正确测试学生能力的机会。
永远不要把你的数据集弄混
如果在深入研究之前没有仔细地整理和拆分数据,你将如何防止上述问题?数据拆分是最好的数据科学快速修复方法。在你开始教你的学生之前,一定要把测试的例子锁在一个安全的地方。
在你确定考试标准之前,千万不要开始考试
马上就开始?住手!虽然这一点似乎太明显了,但你会惊讶的发现,真正的项目团队在领导能力薄弱的情况下,往往会进行测试,然后改变,这样他们的学生的成绩就足够好。不管怎样,别这样。
从不重用测试数据
如果你想对那些坚持说你不能多次使用一个测试数据集的统计学家翻白眼,那么让我们试着用另一种方式来表达:「如果你给同一个学生两次相同的期末考试,不要相信他们第二次的表现。」不要重复使用这些试题!
不要跳过测试
测试可以让你免于灾难,这是你防止发布有问题原型的保护措施。如果你真的不在乎它,那么你有勇气把你的要求的性能标准设置得很低吗?如果不能,那就好好测试。
永远不要太相信自己
还有一个薄弱环节,那就是你自己,教授。如果你没有意识到你的考试设置得不好怎么办?比较少 最好的人也可能犯下这个错误。为了以防万一,一定要建立一些安全网,以将你没毕业的学生和外界隔绝。
如何成为 AI 白痴
当团队缺乏熟练的人工智能领导能力,或者当他们过于沉迷于工程的细节时,他们的常识可能会被忽略。他们可能会忽略基础知识,最终发布真正糟糕的解决方案。几乎我在现实生活中看到的每一个糟糕的 ML/ai 灾难都可以追溯到上面列表中的一个条目,所以如果你在寻找 AI dunce 帽子,我给了你一个很好的错误列表供你选择,请自便!
但是,如果你想建立一个好的,有用的,有效的人工智能解决方案,那么请时刻记住教授的观点。关于几区学习教学,就这些了!
via:https://towardsdatascience.com/how-to-be-an-ai-idiot-8559c65d91a8
雷锋网雷锋网雷锋网