雷锋网按:由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办的第七届全国社会媒体处理大会(SMP2018)将于 2018 年 8 月 2-4 日在哈尔滨召开。大会包含 4 场讲习班报告、6 场特邀报告、9 场专题论坛、2 场口头报告。
SMP 专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,旨在构建社会媒体处理领域的产学研生态圈,成为中国乃至世界社会媒体处理的风向标。
9 场专题论坛如下:
技术评测论坛
智能金融论坛
计算社会学论坛
情感分析论坛
数据挖掘论坛
计算传播学论坛
智能司法论坛
计算历史学论坛
智能教育论坛
技术测评论坛和情感分析论坛的详细安排已经出炉,详情请点击如下地址:
https://www.leiphone.com/news/201807/g8vDHOGG8QAf8N5r.html
计算传播学论坛的议程也迎来更新,论坛简介及报告内容如下:
论坛时间:2018 年 8 月 4 日 13:30-15:30
论坛简介:计算传播学致力于寻找传播学可计算化的基因,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理。最近几年,计算传播学正在成为计算社会科学中重要的研究领域。本次论坛邀请了北京航空航天大学许可教授、南京大学王成军副教授以及北京八友科技有限公司总经理梁斌博士分别从在线信息与情绪传播、数字媒体中的注意力流动以及社交媒体数据获取三个层面对计算传播学进行多面向探讨。
主讲嘉宾
北京航空航天大学软件开发环境国家重点实验室 许可 教授
许可,教授,博士生导师,工作于北京航空航天大学软件开发环境国家重点实验室。获「全国百篇优秀博士论文」奖和中创软件人才奖。现任《中国大百科全书》第三版计算机卷算法分支主编。研究方向包括算法和人工智能等。研究成果发表于 AIJ、JAIR、IJCAI、AAAI、TKDE、KDD、VLDB、ACL 等人工智能、数据挖掘、数据库和自然语言处理领域的国际顶级期刊与顶级会议。提出的 RB 模型被广泛应用于算法研究和国际算法竞赛,并被写入《The Art of Computer Programming》和国内外教材等 20 余本书籍。近年来开展了计算机与社会科学的交叉研究,相关成果发表于 JCMC、SocNet、SCIM、PRE 等传播学、社会学、情报学和物理等学科的国际权威期刊。网络情绪传播的成果被 BBC 等全球数百家媒体报道,并被写入国内外教材、学术专著和畅销书等 30 多本书籍。
报告主题:网络信息与情绪传播研究
报告摘要:首先介绍利用大数据分析所得到的两个发现:
(1)普通民众的参与对社交媒体流行趋势的形成有决定性的作用;
(2)愤怒是网络上最容易传播的情绪,然后分析愤怒情绪的传播机理并从历史和社会的视角来看群体情绪的形成及其影响,最后谈一谈对网络社会建设的一些思考。
南京大学新闻传播学院 王成军 副教授
王成军,传播学博士。现为南京大学新闻传播学院副教授,奥美数据科学实验室主任,计算传播学实验中心副主任。参与翻译《社会网络分析:方法与实践》(2013)、合著《社交网络上的计算传播学》(2015) &《计算传播学导论》(2018 年即将出版)。
报告主题:社会阶层与数字媒体中的注意力流动
报告摘要:数字媒体改变了人类的生存方式,加速了社会阶层的再生产。当我们上网、看新闻、浏览网页的时候,我们的注意力在不同的信息当中流动。数字信息构成了我们每日的精神食粮,充当着一种社会知识。
从社会群体的角度而言,我们的注意力在形形色色社会知识中的流动冲刷出来一个社会知识的空间,而每一个人每天孜孜不倦地在这个空间中穿梭。但是,不管人类在虚拟世界和物理空间的行为实际上都受到社会阶层的重要影响。数字媒体记录下来人类的媒介使用行为,为我们研究社会阶层对人类在知识空间中的移动行为影响及其内在机制提供了新的数据。
借助于计算社会科学,尤其是网络科学,我们可以构造出社会知识的空间,并详细刻画海量的个体在这个知识空间的移动。我们假设社会阶层会型塑人们的日常生活方式和阅读行习惯,造成知沟在群体中的出现,并进一步稳固已有的社会阶层。初步的研究发现证实了社会阶层的影响,例如穷人会使用更多不常用的个性的 app,而富人更多使用一些常用的手机 app;穷人阅读娱乐型内容多,富人阅读知识性内容多。
北京八友科技有限公司 总经理 梁斌
梁斌,2015 年获得清华大学工学博士,长期从事社会媒体的数据抓取和分析,目前担任北京八友科技有限公司总经理。曾在搜狗搜索,金山词霸任职,编写《走进搜索引擎》第一、第二版,翻译《Managing Gigabytes》,自主研发大规模 Key-Value DB,SNS 寻人系统等多个工具,发布经纬度行政区域查询,提供全球经纬度查询行政区域服务,粒度可达县区级的 LEVEL3。
报告主题:社交媒体数据的大规模获取
报告摘要:本报告从新浪微博数据抓取展开,就社交每天数据抓取中最常见的几个问题进行分析。
1)如何获得大量代理 IP,不同渠道的优缺点和价格。
2)如何获得大量账号,不同渠道账号的优缺点。
3)怎么解决账号自动登录问题(逆向协议)。
4)抓全微博数据的主流方法
5)如何有效部署整个爬虫系统。最后就一些其他细节问题展开讨论。
更多详细信息,请参见大会官网 http://smp2018.cips-smp.org/
雷锋网将会第一时间为大家带来最新消息。雷锋网