学习资料
同济子豪兄-中文精讲视频:https://www.bilibili.com/video/BV1pR4y1S7GA
官方原版视频
Youtube视频:
https://www.youtube.com/watch?v=JAB_plj2rbA&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=1
https://www.youtube.com/watch?v=JAB_plj2rbA&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=2
课程主页
https://web.stanford.edu/class/cs224w
Graph Representation Learning Book:https://www.cs.mcgill.ca/~wlh/grl_book/
Lecture 1.1 - Why Graphs:https://www.youtube.com/watch?v=JAB_plj2rbA&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=1
Jure Leskovec
个人主页:https://cs.stanford.edu/people/jure/
谷歌学术主页:https://scholar.google.com/citations?user=Q_kKkIUAAAAJ&hl=zh-CN
图机器学习编程工具
PyG:www.pyg.org
NetworkX:networkx.org
DGL:www.dgl.ai
AntV图可视化工具Graphin:graphin.antv.vision
AntV图可视化工具G6:g6.antv.antgroup.com
Echarts可视化:echarts.apache.org/examples/zh/index.html#chart-type-graphGL
AlphaFold
AlphaFold官网:https://www.deepmind.com/research/highlighted-research/alphafold
AlphaFold蛋白质数据库:https://alphafold.ebi.ac.uk
AlphaFold博客1:https://www.deepmind.com/blog/alphafold-using-ai-for-scientific-discovery-2020
AlphaFold博客2:https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
AlphaFold代码:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13
百度文心·生物计算大模型:https://wenxin.baidu.com/wenxin/paddlehelix
人工智能在药物发现和生物技术中的应用:2022年回顾与关键趋势:https://mp.weixin.qq.com/s/ZuDpd2YqHpDiRqw9GIXolw
思考题总结
打开你的手机,里面那些APP用到了图机器学习和图神经网络的技术?
各类涉及内容个性化推荐、社交网络、银行金融APP。
A股、港股、美股市值最高的上市公司,哪些公司的核心资产是图?
①做C端客户的公司,当用户积累起一定数量后,就能够构建出用户网络,这就是核心资产,②金融类交易类公司,无论是投资借贷都需要背调,这需要关注整个体在整个环境种的位置以及潜力,以此来评估和做决策,③设计类公司,由于设计行业大多数时候为各种元素的组合与创新,因此将元素抽象为节点,将组合关系抽象为边,那么就可以利用上图,例如制药业、文学创作和服饰设计等等。
马化腾在2022年12月内部讲话提到,微信视频号是整个腾讯的希望,请从图的角度解释这句话。
视频是包含信息最丰富的媒介,有了这个丰富的信息媒介(即信息丰富的节点),才能构建起更为紧密和合理的社交图,才能为腾讯的社交服务注入新的活力。
在你自己的研究领域,哪些数据可以用图或者网络来表示,如何进行图数据挖掘?
作为一个码农,最常见的就是class图和算法模块图,对着两种图进行数据分析与挖掘,从工程方面看可以优化软件设计架构,从算法层面看可以优化对比算法流程。
近年来,图数据挖掘在哪些领域带来了革命性进展?
①医药领域 ②广告领域 ③数据分析领域 ④社会管理领域
图数据挖掘解决哪些基本任务?
①针对节点的预测与分类 ②针对边的预测与评估 ③针对整图的分类与分析
分别从图、连接、节点三个层面,举例解释图数据挖掘在生物医学方面的应用。
图层面:用于新药物的开发,推断新药物的分子式
连接层面:根据病症的具体表现,寻找到对症的药物
节点层面:根据症状表现推到是否确诊某种疾病
图神经网络为什么是端到端的?为什么不需要人工做特征工程?
本质上图神经网络也是神经网络,也遵循着监督学习的那套理论,所以是端到端的,省略了人工特征工程的步骤。
图神经网络和其它神经网络有什么区别?
图神经网路处理的是非欧式的数据,因此它的输入与输出都是不确定的。
简述AlphaFold的基本原理,它解决了哪些以前解决不了的问题?
给定蛋白质的氨基酸序列,AlphaFold能根据这些氨基酸的排布先后顺序以及氨基酸自身特性而预测出蛋白质的空间结构图。
图机器学习和传统机器学习有什么区别和难点?
输入的尺寸不固定,复杂的关联结构
没有固定节点顺序和参考节点
具有动态性,数据回实时变化,起数据可能是多模态的
图机器学习的编程工具有哪些?看看它们的官网吧(Graphgym、pyG、networkx、dgl、Pytorch、AntV、Echarts)
其它阅读材料
李笑来-惊喜与创造惊喜的方法论:https://zhuanlan.zhihu.com/p/475615463
乔布斯在斯坦福大学毕业典礼的演讲:https://www.bilibili.com/video/BV1oW411h7Ea
子豪兄1024脱口秀-乔布斯传奇:https://www.bilibili.com/video/BV1Zf4y1g78Q
哥尼斯堡七桥问题:https://zhuanlan.zhihu.com/p/519123688
2022 IDEA大会|BIOS V2正式发布,数据驱动构建超级医学知识图谱:https://mp.weixin.qq.com/s/vuHGUtWbiIH-pJ6MZaxl5Q