加入收藏 | 设为首页 | 会员中心 | 我要投稿 广州站长网 (https://www.020zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

只需五步!哈佛学霸教你用Python分析相亲网站数据,在两万异性中找到真爱

发布时间:2019-10-13 03:02:14 所属栏目:优化 来源:Wired 编译:啤酒泡泡、张大笔茹、张睿毅、牛婉杨 想脱单
导读:副标题#e# 大数据文摘出品 来源:Wired 编译:啤酒泡泡、张大笔茹、张睿毅、牛婉杨 想脱单?那还不容易! 如果身在美国,就像其余四千万单身男人一样,注册一下Match.com, J-Date和OkCupid等相亲网站,坐等真爱上门不就可以了。 但是相信大多数人和McKinlay一

现在只需要决定哪个类群最适合他了,在抽查了每个类群的一些档案后,发现一个类群太年轻,两个太老,另一个太“基督”了。于是他徘徊在一个二十五岁左右的女性主导的类群中,工作类型比较独立,像是音乐家和艺术家。这简直是黄金单身群!

就像是大海捞针,他找到了他的针,也就在这个类群的某个地方,他找到了真爱。

一个相邻的类群看起来也引起了McKinlay的注意:年龄稍微大一些,从事专业的创造性工作,如编辑和设计师。他决定将两个类群都设定为自己的目标!于是设置了两个配置文件,A、B组各优化一个。

第四步:真诚填写相关问题,找出灵魂伴侣

他对这两个类群进行了文本挖掘以了解她们感兴趣的内容:教学是一个热门话题,因此他撰写了一篇强调了他作为数学教授工作的文章。

更重要的是回答问题,于是他挑选了两个类群中最受欢迎的500个问题并决定诚实地填写答案,他不想在计算机生成的谎言的基础上建立未来的恋爱关系。但是他会使用一种称为自适应提升的机器学习算法来得出最佳权重,从而让计算机确定分配每个问题的重要性。

只需五步!哈佛学霸教你用Python分析相亲网站数据,在两万异性中找到真爱

有了这个后他发表了两个照片,一个是攀岩的照片,另一个是在音乐演出中弹吉他。

“无论未来的计划如何,你现在对什么更感兴趣?性还是爱?” 这个问题的答案很明显是爱。但对于年轻的A群,他尊重计算机将问题评为“非常重要” 的结果。对于B群集,它则是“必须回答”的问题。

当回答完最后一个问题时,他按照匹配百分比对洛杉矶的女性进行了OkCupid搜索。从头开始:第一页匹配率全是99%女性。向下滚动......然后......向下滚动……,来自洛杉矶各地的一万名女性迎面而来。

离被关注还差一步! OkCupid会员在有人查看他们的网页时会收到通知,因此他写了一个新程序来访问查看他主页的女性的主页,并按年龄循环:周一有1000名41岁的女性,周二有1000名40岁的女性。两周后,轮到了27岁的女性。女性会回访他的个人资料,每天约400名左右。然后,私信开始滚滚而来。

“直到现在我还没有遇到过如此匹配的人,而且我发现你的个人资料很有趣,”一位女士写道,“对于一个擅长数字的粗犷男人......我觉得我想认识你。”

“嘿,你的个人资料很棒,我想认识你,”另一位写道,“我认为我们有很多共同之处,也许不是数学,但肯定还有很多!”

“你真的会翻译中文吗?” 还有人问道,“我上了一些课,但学的并不好。”

至此,数学部分已经完成。接下来,他需要离开他的小隔间,进入实际演练阶段,他要去真正的约会!

第五步:走出小隔间,来一场真正的约会

6月30日, McKinlay开着他的尼桑穿越城镇来到加州大学洛杉矶分校的健身房,开始他的约会实践。Sheila是一位来自“A类群”的年轻的网页设计师。他们在Echo Park的一家咖啡馆吃了午饭。 “太不可思议了,这简直像一场学术活动一样。”

与Sheila约会结束后,双方都觉得不来电。第二天,McKinlay进行了第二次约会,一个来自 “B类群”的博客编辑。他们计划在Echo Park Lake周围散步,却发现正在施工。女方一直在读普鲁斯特并对生活感到失望。 “这有点令人沮丧,”他说。

第三天的约会也来自“B类群”。他在韩国城的一家酒吧遇到Alison。 她是一名实习编剧,肩膀上还纹了斐波那契螺旋。McKinlay喝了很多韩国啤酒,第二天带着痛苦的宿醉在他的小隔间醒来。他后来在OkCupid上私信她表示想继续约会,但她没回。

虽然他被拒绝了,但每天仍然收到20条消息。实践约会显然与计算机配置文件约会是完全不同的。他开始忽略一些主页没有内容的人的消息,只回应那些有幽默感或在首页展示一些有趣的东西的人。以前他作为主动方,会交换三到五条消息来获得一个约会日期。现在就只发一个回复。 “你看起来很酷。想见面么?”

20个约会之后,他总结了一些潜在的规律。在较年轻的群体中,女性大多数有两个或更多的纹身,而且住在洛杉矶的东边。另一组中,她们疯狂的喜欢中型犬。

早期的约会他会经过精心策划。但当工作越来越忙时,就开始在午餐或咖啡时间偶尔参加休闲聚会,而且经常一天之内约两场。他制定了一套个人规则来完成“马拉松爱情”搜索:不再约喝酒,如果不来电就赶快结束不要拖拉,不约音乐会或电影。 “约会中你们需要关注的是彼此而不是别的什么东西,不然效率会很低。”

经过从他的两个档案中同等挑选约会的一个月后,他发现他耗费了太多时间在纹身群中接触东边的女性。他删除了他的A组简介。他的效率虽然提高了,但结果是一样的。随着夏天即将结束,他已经有过超过55次约会,每日都尽职地在实验笔记本上记录。只有三个产生了第二次约会,只有一个进行了第三次。

大多数不成功的约会者都面临着自尊问题。对于McKinlay来说其实更糟糕。他不得不检查他的计算。

后来一个来自28岁的艺术家Christine Tien Wang发来了消息。McKinlay之前在加州大学洛杉矶分校附近搜索到她,6英尺高蓝眼睛的人,正在那里修她的美术硕士学位。他们有91%的适合度。

(编辑:广州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读