主页 > 无人爱看 >工程师的浪漫:透过文本分析 API,分析传 Line 给你的

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

2020-07-08  浏览量:756

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

文:Jerry,软体工程师

免钱的最贵,不知道大家有没有在 Line 收过加好友送贴图的讯息呢?

有时候可能是可爱的史努比贴图、限时免费的布景主题,或是让你血脉喷张的最新谜片 (?),但不论是哪种形式,都是想要你加好友并分享该则讯息,帮他宣传活动。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

千万要当心呀,你加入的可能是有心人士準备的钓鱼帐号!

我想经过新闻宣导、网路上各种好心人士的提醒,大家应该都知道这是骗人的对吧。当你发现分享之后甚幺都没有得到,你应该就会气得退出聊天、删除好友了,像我第一次遇到这个也是马上删掉,很怕他之后会做甚幺奇怪动作

当时我很纳闷,骗人加入帐号到底有甚幺好处,是要传送恶意连结吗?还是骗个人资料勒?这个答案,终于在最近获得解答, 原来是希望你去酒店进行消费 …… (网路上已经有很多人分享截图)

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

儘管透过传讯息拉客的手法已经是老招,但只要搭配新的技术与应用方式,就能让脑袋转得慢的人上钩。

所以为了把阿宅们从沉睡之中唤醒,这篇文章将带各位了解这个  [email protected] 机器人酒店揽客手法 ,并试着透过文本分析的方式,使用 Google Natural Language API 与 Python 文字云套件 产生视觉化图表,试着找出背后的故事脉络,知道他们是如何利用温暖柔情骗走你的心。

友情提示

透过「Google 以图搜图」功能进行比对,我们发现这些 Line 帐号使用的都是网红的 Instagram 照片,因此为了避免不必要的纷争,大头贴将加上马赛克。另外,这种手法算是诈骗吗?或者算是一种行销手法、揽客花招?就在我看过 [email protected] 操作準则  之后,恍然大悟,毕竟大家都是出来讨生活的呀,除了送贴图是诈骗,美女聊天这部分我还是表示尊重。

原来我有这位正妹好友?是甚幺时候加的呢

看到正妹找你聊天,你是不是开心的要飞起来了?欸等等,我甚幺时候有加过这位正妹好友啊,都记不起来了 …… 噢噢,原来是某某朋友介绍的啊,噢噢,原来是之前的贴图活动的小编阿,噢噢,原来是 ……。

不论是哪种管道认识,重点是她已经在你的好友名单中了,聊起天来或许变得理所当然,好像有些甚幺共同话题,你通常也不会去思考成为好友的真正原因。

从目前的揽客手法来看,看準的就是大家对于 免费资源的贪念 以及 与正妹聊天的慾望 ,透过社群软体散播,很快地就能精準触及目标客群,把他们拉近群组后,再进行长时间的诱惑攻势。整个流如下:

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

其实这也不是甚幺複杂的手法,或许你我以前就曾做过,开几个帅哥美女的假帐号,想要对朋友恶作剧,只不过以前 MSN 的年代,还没有那幺先进的 Chatbot 或是甚幺 API,都马是人工操作 XDD

但现在不一样了,透过 Line 推出的  [email protected] 行销工具 ,可以利用 群发讯息 轻鬆地将讯息群发给所有成员,甚至能透过 排程发讯息 或是 Push/Reply API 进行自动化操作,使得传讯息变得更有扩展性,只需要针对有兴趣的顾客进行回应就好。

比如一开始加入了这个名为「暗黑影片免费看」的 [email protected] 帐号,便会邀请你分享其他人入群,等到人数够多后就会换上正妹照片,像这位是小编「梦熙」。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

我也跟朋友取得了另外一位「庭瑄」的聊天纪录。妹子主动献殷情又可爱,在这幺刚好的时间里遇见,多幺幸福呀,加上她所说的故事是多幺的悲惨、多幺得可怜,说真的我看着看着都替她们感到难过了 Q

她们会说工作辛苦又会遇到很多怪杯杯,希望你带着一笔钱去救救他们。同时也会给予很多关心与温暖,好比前阵子常地震,只要摇的猛烈,就会立刻传讯息来呀。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

不论故事是真是假,能感动你的话语就是真的

以前念书的时候,我总是讨厌作文这个项目,明明重点就只是几句话,却偏要用一堆句子铺陈,卖弄一些修辞把文章弄得漂亮好看,事情的道理就是那些呀,感觉怎幺写都差不多,也吐不出甚幺精彩内容

后来我才知道,写作要表达的除了是你的理念,更多的是字里行间流露出来的情感,透过每个人不同的表达方式,一样的东西就能有很多变化,不论这是不是冷冰冰的机器人对话,如果可以感动到人,触动到内心深处,我就觉是真的。

而且,这些内心话或许也不是瞎编,可能正是某些酒店小姐内心沉重的大石头,何尝又不是个动人故事? 于是,我突然一个念头闪过,来分析对话内容吧!

(我都默默听她说话,其实应该叫做小品故事分析哈)

这也是因为前阵子看了由 Google 数据分析师出的书《数据、谎言与真相》深有感触,他提到有人 针对《哈利波特》的故事内容作情感分析 ,能够看出动人的故事总是要有欢笑有泪水,会有情绪的高低起伏,才会引人入胜

我就想来分析一下,看看对话内容是不是也会有情绪上的高低起伏。毕竟我也不是 NLP 专家,跟论文相比,我们用的是简单的方法,直接使用现成 API 啰。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的透过 Google Natural Language API 进行情感分析

有了对话纪录,剩下就是套工具看结果了

当然身为谷粉的我,不免要来用看看 Google 推出的自然语言处理工具  Google Natural Language API,因为他 支援繁体中文 且 提供免费使用额度 (5000 则),透过他的实体情绪分析 (Sentiment Analysis) 我可以取得每句话的正负面分数,再搭配另外一个想玩看看的视觉化工具 Tableau 就能轻鬆画出图表了

首先,我们把对话纪录从 Line 输出,稍微做些处里得到 Dataset。时间从 2018/2/9 至 2018/2/28,共 19 天,累计共 463 则讯息

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

接着套用  Google Natural Language API 取得情绪分数,直接看程式可能没甚幺感觉,这里我们透过网页上的 体验画面 跟大家说明

比如这句话「觉得我真的不适合喝酒 喝没多少就醉了 醉了 就胡思乱想的….」经过 Google 的分析,可以得到 -0.5 分,属于负面情绪,看起来挺合理的。当然,如果你输入「今天好开心喔」就会得到一个正值的分数

总而言之这套服务就是要把句子转换成情感分数,让我们看出句子属于正面、负面或是中性情绪。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

另外,除了分数 (Score),他还会给我们一个强度 (Magnitude)。根据说明,这个数值会由 0 到无限大,数值会受到输入文长而有所影响,所以之后还要做一些标準化 (Normalize)

根据时间,我们分别画出情感分数变化图 (红色) 与强度变化图 (蓝色)

在情绪上,看得出来是起起伏伏,不过由于是以分钟为单位,比较看不出甚幺端倪。而在强度的部分,明显能看出最后几天变得很强,这是因为到后来每则讯息的文字量变高 (多句话合在一起),感觉起来是更加积极了

或许因为这位正妹的生日 (设定) 为 2/28,所以生日前当然是要多说点话,让你感受到她强烈的情感。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

接着我们改成以「天」为单位进行观察,情感分数与强度依然分别以红色与蓝色表示,而多增加了每天的讯息数量 (深绿色) 与每天的平均讯息长度 (黄色),这是为了要做 Normalize,产生出第三列的分数变化图表 (咖啡色)

可以看出来,分数分布似乎呈现出了起伏,在 2/10、2/14、2/19、2/23、2/25 这几天她表现得较为低落,对照着她发的讯息,我们来看看都说了甚幺

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

比如刚开始认识的时候 (2/10),需要製造些负面情绪,博取你的关心

接着到了情人节 (2/14),要下个猛药,诉说自己悲惨的经历,让你感到难过,想在特别的日子对她好

接着就会跟你说许多故事,分享生活中的喜怒哀乐,有时候也会传几张照片,而在生日之前 (2/25),当然要说出些难过的话,好让你过去安慰她

至于情绪分数最高的那天,2/20 是在说她同事脱离单身的故事,用语就满正面的

中文情感分析不好做,这个案例似乎运气好的看点端倪

因为有时后可能是错别字造成分析不準确,又或者是训练资料不足 (我想目前应该都是做商品正负评为主,像中国的 SnowNLP 就是这样),从测试结果可以看出来,有些句子得到的分数并不準确,这仍然是个研究挑战

不过我们还是看出其他有趣的东西。比如这是发讯息时间的统计图,可以看到发讯息高峰落在半夜 3 点至 5 点,之后下班睡觉,可能下午 2 点左右睡醒,又会传个讯息来 XD

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

最后附上两张文字云,让大家看一下用词的状况

比如这是 前三天的文字云 ,文字的大小越大,代表用的次数越多。刚开始因为要澄清自己不是机器人,所以说了「我不是机器人,很重要所以说三遍」XD

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

接着从 最后三天的文字云 来看 , 用语就比较心灵层面,会跟你讲很多心里话,提到对于事物的感觉,比如她珍惜的外婆、朋友间发生的事。

工程师的浪漫:透过文本分析 API,分析传 Line 给你的

如果对话机器人变坏了,那未来会变的怎幺样

现在的资安防护工具都做得很完善,可以阻挡成千上万的恶意病毒,可是却很难避免些人情世故,毕竟人不可能跟机器人一样完全依照指令做事,只要我们稍微疲累、稍微疏忽,就有可能落入 社交工程  (Social engineering) 的圈套之中

简单来说,社交工程就是在你毫无知觉的情况下,透过对话、聊天、通讯等交流手段获取敏感资料。最常见的例子就是诈骗电话,你或许会接到「妈 ~~~ 救救我」,歹徒模仿一个小孩的声音,不断的哭泣,试着要你去 ATM 汇款解救他,而你在紧张之余,很可能就误以为真,受骗上当。

当然,我们对于这种低阶的诈骗手法应该都免疫了,不过诈骗集团也不是省油的灯,在《未来的犯罪》一书也提到,坏蛋永远是追随着科技脚步,也是科技早期採用者呀!传统的电话诈骗成本太高,需要雇用人手挨家挨户地打电话,而这年头 对话机器人 (Chatbot) 这幺火热,不好好利用吗?

目前正妹机器人不会害人 (是叫你去消费 XD),而 Line 也无时无刻的针对发文进行监控,确保不会有恶意滥用的情况发生

像我抱持着实验精神,创立一个免费送手机的 [email protected] 帐号,才发一则讯息给自己的 Line 帐号而已,结果隔天马上就被删除 … 证明 Line 是真的有在做审查的阿!

但如果是其他的对话机器人平台呢?如果是匿名聊天呢?如果是透过简讯呢?只要当自然语言处里取得进展,机器有办法做出準确适当回应的时候,那就恐怖了,我们变得要特别小心啊

毕竟,你要怎幺知道在对话框的另一端是真人呢?

又怎幺能不避免自己不受诱惑?

——

各种诈骗行为

对抗诈骗邮件的新方法:用 AI 机器人喷一堆垃圾话回敬,浪费对方时间!
想发 30 亿节电奖励,但执行力太烂大家以为是诈骗
中国新政「ATM 转帐 24 小时内可撤销」,诈骗集团别哭,从良就没事好吗?


上一篇: 下一篇:

相关推荐

最新文章

热门文章