植物识别bot @plants

确实在运转了,实现了的功能就是发图片at它就会调用PlantNet的识图API来识别植物名,用Google翻译API翻译成汉语并回复。如果原嘟里提到了“花”或者“果”或者“干”会优先识别这部分,否则默认识别叶子。

目前这个script是跑在我自己的电脑上,每五分钟刷新一次。基本上算是实时回复了。

还没实现的两个功能,一个是给植物的照片配一句话,这个再说了,实际用处不大。一个是把它放到一个24/7联网的电脑上跑,下周找一天去把它挂在学校办公室的破电脑上(破电脑去年被别人顺手关机了,要不然24/7在线还可以远程操作)

现在音乐的和弦理论里主要的和弦理论是黎曼功能分析(Harmonic Function Analysis),主要分三种,Tonic,Dominant,Subdominant。Tonic和Dominant奠定了调性,Subdominant是作为准备Dominant的存在。所以通常我们在讨论和弦的时候看的不是具体和弦而是它们代表的功能,如果我们把所有和弦通过罗马数字表示的话,大写代表大和弦,小写反之。I,VI一般作为Tonic来用; ii, IV作为Subdominant ;V, vii就是作为Dominant出现了。我们经常会看到Tonic-Subdominant-Dominant-Tonic这种序列,也是由上面讨论过的功能决定的。所以在爵士里经常会出现 ii - V - I这样的和弦顺序。Giant Step本质上也是这样的,只不过整首歌一直在通过各种调里的这个序列来换调。比较好玩的是我一开始不知道最开始的Bmaj7是作为什么用的,但在最后的两个和弦就是它的ii和V,有点像recursion。当然在不同的Tonic之间它们也可以作为彼此的Dominant/Subdominant,不过这就是另一个话题了。我用线标出来了一些我能看到的。其实我也不是很厉害看不到更大的结构,但这首曲子,或者说整个爵士都是建立在功能上看的。@Cronopio

昨天sci站在讨论给植物说话的模型,我今天找到了一个网站可以用各种语言模型做续写,我写半句,让机器补全剩下的(图中灰色高亮的部分是机器写的)。这首写给树的诗还挺有意境的,甚至有些禅意,分享给大家:

The tree said : 'You know, I'm tired.
and another tree said: "This is the tree of a dead man."
but the grass said: "No, this is the tree of the living God."
the daffodil said: "What is it , O Lord? the peacock's nest?"
and the figtree said : "It 's just a fig that's in a fig tree."
said the palm tree: "There is no tree in this region."

我的翻译:
那棵树说:“你知道,我累了。”
另一棵树说:”这是死人的树。“
但草说:”不,这是活神的树。“
水仙花说:“主啊,这是什么?孔雀的巢穴吗?”
无花果树说:”这只是无花果树上的一颗无花果。“
棕榈树说:“此地并没有树。”

(*模型) transformer.huggingface.co/

【前情提要】上回我们说了受激辐射( moresci.sale/@boxue/1068045984 )也就是激光的发光原理,是说激发态电子受到另一个光子的激发,回到基态并辐射出一个同样能量的光子。
【本回内容】但是激发态不宜久留,电子自己也会回到基态,多余的能量就会辐射出光子,这个过程叫自发辐射。自发辐射又可以分为荧光(fluorescence)和磷光(phosphorescence),不同之处主要在于这两个过程产生辐射的激发态不一样。图1是电子能级示意图,S_0基态,吸收一个紫色光子被激发到了S_1激发态,如果从S_1直接落回基态,这就是荧光。由于降落过程中会以振动形式损失一些能量,所以荧光发射的光可能是绿色的,从吸收光到发射光的波长差叫做斯托克斯位移。如果没有从S_1直接回到S_0,而是先来到了T_1态再回到S_0,那这个发光过程叫磷光。那S和T是什么意思呢?S指的是单重态(singlet state),在单重态下一对电子的自旋方向相反,图2左就是S_0,两个电子都在能量最低轨道而且自旋方向相反,激发到S_1(图2中)则两个电子的自旋方向不变,只是有一个来到了更高能级。如果被激发的电子改变了自旋方向,这一对电子的自旋方向就一样了,这就是一个三重态(triplet state),见图2右,那么它要回到基态就得再把自己转回来,因为同一个轨道的两个电子自旋方向必然不同(泡利不相容原理)。T_1的能量通常比S_1低一些,但是电子自旋方向发生改变的概率比较小而且比较慢,所以磷光通常比荧光弱很多,而且发光寿命(τ)长很多。磷光和磷元素没啥关系。Java和javascript有啥关系吗?
水母发光主要有两种蛋白的参与,第一种是水母素,这种蛋白结合钙离子和氧,会发出470nm蓝色光;第二种是绿色荧光蛋白(green fluorescent protein, GFP),它吸收水母素发出的蓝色光,然后荧光辐射出绿色光,所以叫绿色荧光蛋白!荧光蛋白的研究工作在2008年获得了诺贝尔化学奖,授予了在普林斯顿抓了一万只水母提取1mg水母素和GFP的下村脩、率先把GFP编码DNA转入秀丽线虫让线虫发光的Marty Chalfie,以及诱导GFP突变获得其他很多色的钱永健。荧光蛋白标记让我们得以追踪活体生物过程,此前万古如长夜(?
图3是钱永健课题组用转了不同色荧光蛋白的细菌涂的培养皿 (Zimmer, Marc. "GFP: from jellyfish to the Nobel prize and beyond." Chemical Society Reviews 38.10 (2009): 2823-2832.)
@mature

心虚地在快两个礼拜以后把它捞起来……
Day 2:一首在歌名里带有数字的歌
能想起来的只有专辑所以用专辑代替了……

13 - Blur(1999)
Blur前期的专辑(Parklife之前)我都嫌太过流行难以入耳,唯独13可以反复听哈哈

Eulogy for Evolution - Ólafur Arnalds(2007)
冰岛天才音乐人Ólafur Arnalds震惊四座的处女专,每首歌都用四位数字命名。后摇/氛围/极简/新古典。对器乐的运用可称炉火纯青,某种意义上各种流派的集大成者

New Gold Dream (81/82/83/84) - Simple Minds(1982)
合成器流行/新浪潮的经典之作,当时被形容为“zenith of modern pop music”.这个乐队很有意思,长寿、优产但不知名,擅长使用高昂宏大的合成器音效却配合后朋克式紧张急促、低沉阴郁的slap bass,营造出一种辉煌但怪异、华丽但忧伤的城市曲调。我一直觉得他们歌曲有点像一个正在建造摩天大楼的血汗建筑工人观察大都市的视角,这点在1981年的Sons And Fascination / Sister Feelings Call中体现得更为明显。我觉得他们是集过时、流行与前卫于一体的一个古怪组合

Second Coming - The Stone Roses(1994)
本世纪最controversial的hot take:石玫瑰的二专比一专要好听(被britpop粉丝打死)

Talking Heads: 77 - Talking Heads(1977)
Talking Heads77年的首专,在朋克和70年代兴起的Roxy Music, David Bowie式艺术摇滚中艰难地寻找自己的声音。没有1980年的Remain In Light(aka余光中)成熟,但已初具雏形

Alive 2007 - Daft Punk(2007)
电子音乐中有句话这么说:比蠢朋克优秀的一定没他火,比蠢朋克火的一定没他优秀。名副其实的一张极其优秀的电子音乐模范现场

808:90 - 808 State(1989)
“arguably the best LP ever produced in the style”,酸得要死的acid house,90年代techno的先驱。纯电子音乐,很凶

NEU!75 - Neu!(1975)
Krautrock德国泡菜摇滚,实验摇滚的雏形。没有Can那么晦暗阴沉,也没有Kraftwerk那么机械空灵,一场温和的迷幻之旅

3 Feet High and Rising - De La Soul(1989)
不怎么听说唱,但这张专辑打破了我对说唱暴戾凶狠的刻板印象,像温暖的冬日阳光洒在身上。“Sgt Pepper of the 90s”,融合了爵士和蓝调的很温和的原初hip-hop

101 - Depeche Mode(1988)
虽然是Live,但对DM这种纹在我手臂上的乐队,我还有什么原则……20岁的某一天我打开了这场1988年Pasedena的现场,从此DM改变了我的整个人生。打铁音乐发家的赶时髦live里对现场打击乐器的运用简直是销魂蚀骨

1984 - P.K.14(2013)
对国摇不甚熟悉,但PK14是我始终在追的一支中国乐队,“以一己之力定义了中国后朋”。Van Halen也有一张同名专辑1984,我也很喜欢,但对金属始终还是有点敬而远之的感觉

写完这些发现我的口味真容易预测啊……

Show thread

非常奇怪,最近身体一直在“近感冒”边缘徘徊,头晕目眩、精神萎靡、没有胃口,躺着就开始晕,手脚发热出汗,但量体温又没有发烧。也不咳嗽、流涕、嗓子痛,简而言之就是没有明显症状,但有亚健康的躯体症状。因为去医院就有风险被拉去隔离所以完全不想去,喝了点感冒灵和消炎药。不知道是不是过劳了,因为这个缺了课,感觉很难过……

而且据我对各种群组的观察,感觉一个大问题是不少人没有回复时去掉@group的意识,导致群组内信息有点重点不清(。 我思考有没有可能改善一下mastodon的group接口,比如说分两个API:一个是@group-list-as-public,只有手动at到这个才会自动转嘟,而回复时只@group就不会自动转嘟,不会显示在版聊的首页。说到这个我想起来好像有的实例魔改以后用户个人主页不显示转嘟只显示原创,我觉得这是一个很不错的功能

Show thread

dating组和studybuddy组真的应该分开……我personally觉得有效学习靠定期写博客做系统输出比靠捞random网友来费曼学习法要来得靠谱……

含贩卖焦虑,可能含有个人信息,但只是单纯想不通 

怎么说呢……被学校组织去听优秀毕业生的讲座,让我重新思考了一下学院评判体系下的“优秀”学生的议题。

我很喜欢听行业领军人物有干货的分享,但学校给我的感觉是它并不想让每个人找到适合自己的位置,它只想促进内卷和贩卖焦虑,让这样能装点学校“门面”的人越多越好。如果图中提到的学长能详细谈谈他的论文选题、科研和实习内容,并和同行讨论,我将非常乐意听;但学校所有的“分享”,都是台上一个“楷模”在侃侃而谈自己的人生经验、时间管理和成功轨迹,只有价值观而毫无方法论。

我年级还低的时候被学校的这种倾向坑惨了:我花大量时间逼迫自己搞不感兴趣的内容,只为了光鲜履历,当“人上人”。花了很久才从抑郁中逃脱,重新开始思考生活和评价体系的意义。

附这张图并不代表什么,今时今日再看到学校文宣中这样光鲜到头的履历,我的怀疑已经压过了敬佩,而我觉得这并不出于嫉妒:他在每个领域的投入-产出到底有多少?把这种个例向学弟学妹们宣传到底有什么意义?

我觉得所有的人生阶段中,不一样的“失败者”比千篇一律的“成功者”的分享更有价值。但可惜这是我大三才明白的事情,而限于大学这个森森的体系,我们这些“失败者”的声音完全无法传到刚刚踏进校园,对大学还满怀懵懂的憧憬的同学们的耳中。

想玩Divinity : Original Sin 2,它有NS、Steam、iPad三个平台,我之前已经在steam上买过了,但坐着真的好累,所以……

@mature
机器一旦幽默起来,可不是开玩笑的
hdsr.mitpress.mit.edu/pub/wi9y

这篇综述论文介绍了计算幽默学computational humor。虽然别的动物也有会笑,但是似乎幽默是一种人类特有的能力。至于人类为什么能欣赏和生产幽默,一般认为“不协调性”incongruity是幽默的元素,也就是说叙述的不协和矛盾点恰恰制造了笑料。其中比较广为接受的“不协调-解决”理论
incongruity-resolution(简称IR)把幽默简化成了两个部分:制造不协调(铺垫),再解决它(抖包袱)。这个模型给出了制造笑话的配方,适合机器来学习和生成笑话。文中举例的IR笑话胜“Two fish are in a tank. Says one to the other:“You man the guns, I’ll drive.””,这是个谐音梗,翻译过来大概是“两条鱼在鱼缸(tank坦克)里,一条说,你装炮我开车”,这个叙述乍看起来有矛盾,我们的大脑反应过来原来鱼在坦克而不是鱼缸里的时候,“解决”矛盾产生了快感,是为幽默。

计算幽默学目前主要有三个大用途,一是给笑匠们提供支持帮助,比如自动联想双关语,谐音梗,提供点子,翻译笑话,或者计算笑话的铺垫时长。二是对话机器人需要幽默感来让人类用户感到亲切,比起预先写好的罐头笑话(题外话,siri说的是你),如果能够自动生成笑话更容易被人类当作朋友。三是对于幽默机制的研究本身就需要大量的笑话语料,用来对比测试分析,如果能自动生成这些笑话就最好不过了。

好了,怎么生成笑话呢?九十年代开始的一众论文使用了“填空”的形式:给定一些笑话句式,机器通过近义词反义词来填空,比如铺垫是“什么东西既xx又yy”,包袱是“一个zz的ww”。后续有人让孩子给这些机器笑话打分,最高分的是这个“What's the difference between leaves and a car? One you brush and rake, the other you rush and
brake. ” 额,全是谐音梗,扣钱。

另一种“填空”式机器笑话是“类比”笑话,比如这个“我对咖啡和战争的喜好相同:冷”...近几年的新进展是用生成对抗网络(GAN),一边生成类比笑话,一边给自己打分,来进行训练,这个任务还是比较简单的。

还有一类机器笑话是“改词”,也就是把一句普通的话改一个词变得搞笑,其实就是通过相关性搜寻谐音梗,比如“我昨天不小心吞了墨水,I dyed(died) a bit inside”,这论文全是谐音梗,看得我脚趾头痒痒

现有的大型语言理解模型,比如GPT2,GPT3模型和BERT,让更多的机器笑话成为了可能。甚至可以生成整个standup台本。不过网上好笑的例子都是百里挑一挑出来的,大部分生成的文本可能并不一定有趣。问题在于,这些大模型实质上把词汇含义嵌入在某些空间里理解,而并没有对应具体的拼写,所以很难找寻如上面几个例子的谐音梗(dye-die,tank-tank),GPT2笑话大部分是以“怪”取胜,比如“鸡被卡车撞了之后说了什么?它说“哦我没事”。”GPT3稍微好了一些,可以生产很多自涉笑话(gwern.net/GPT-3#tom-swifties ) 近年的Transformer模型也提供了更多笑话来源,但是笑点也是奇怪。那么问题来了,怎么评判这些笑话好不好笑?

这就是计算幽默学的另一个课题:发现和评估幽默。虽然有很多模型能够区分正常语句和一句话笑话,但并不代表机器学会了辨别幽默性,比如机器看到”食人族“,“酒吧”这些词就直接判断成笑话,准确率也可以很高。更好的办法是从同样的语料库提取“正常”和”幽默“语句,有人用了TED Talk的视频制作了训练数据集。在这项任务上Transformer模型表现非常好,可以学到一些幽默感了。

最后,作者也指出了一个我一直如鲠在喉的问题——这个领域研究的大部分都是英文笑话,而且种类很有限(自反和谐音梗笑话让我想到微博上的“弱智吧”这个号)。我很好奇别的语言语境下能否生成好笑的笑话。相关论文我找到了台湾研究人员用ptt语料做的训练的幽默识别模型,没见到过中文笑话生成器。更深层的问题是,我觉得IR模型可能无法解释一些更隐晦的笑料,比如苏联笑话。单凭“读万卷书”训练来的模型所缺少的,可能恰恰是理解这些笑话所需要的生活经验

Beatles. A hard day’s write 

Please Please Me这张专辑:
I saw her standing there: 这首歌最为第一曲,奠定了Beatles当时在利物浦舞厅演奏的美国beat摇滚的风格。为了更接地气,还特意留下来一开始的“1-2-3-4”,就好像是现场录音一样。Paul说写这个歌也是为了讨好乐队当时演出的受众(大概十七八岁的女生)。贝斯riff完全是偷Chuck Berry的“I’m talking about you”,一点没改动。歌词是瞎写的,本来是she was just seventeen never been a beauty queen, 但是John说这词毫无意义,俩人商量把后半句改成了you know what I mean, 即有一些利物浦市井味道而不那么美国,又带点性暗示

misery: 这首歌主要是John写的,本来是给歌手Helen Shapiro的,但是被她的经纪人拒了。1963年Beatles是给Helen做垫场的七个乐队之一,彼此关系不错。有趣的是Beatles第一张专辑里,Paul的第一首歌唱的是舞池里自信爆棚,John第一首歌唱的是世界待我悲惨。

please please me: Paul说歌词怎么理解都好(也可以是性暗示?),他当时的女朋友Iris说初次听到歌词觉得好烂。John写歌的时候想象着Roy Orbison的声音模仿写的,因为听起来太像了还改了好几次编曲。单曲发售之后Beatles恰巧有机会给Roy的英国巡演做了垫场,Roy给了年轻小子们关于如何打入美国市场的建议,后来果然奏效了。但是他本人直到1987年才知道这首歌是模仿他的风格

love me do: 歌词超级简单,就是我爱你请你也爱我。John的曲子受了福音布鲁斯的影响,还加了一段口琴solo,这是他1962年听了Bruce Channel的演出里的口琴艺人Delbert McClinton之后找后者学的。刻苦学了几天,三个月后就在这首歌里演奏了。简单的歌却很经典

PS I love you: 六十年代初德国夜总会对“美国音乐”有很大需求,但是能演的人并不多,所以很多英国翻版beat乐队会接此类工作。1961年Beatles在汉堡驻演了十三周,每天五小时。累得不行。当时Paul的女友Dot和John的女友Cynthia(二人也成了好朋友)一起来探望,离开后Paul写了这首歌,虽然后来他拒绝承认是给Dot写的。这段关系持续了一阵子但还是在62年夏天分手了。Paul前来提出分手的时候Dot已经和Cynthia一起租学生房住。得到消息的Dot很崩溃,Cynthia也对朋友的遭遇感到难过

do you wanna know a secret: 1962年八月,Cynthia发现自己怀孕了,John和Cynthia紧急办了婚礼,乐队经理Brian Epstein送给新婚夫妇自己的一套公寓租住,解决了住房问题(当时Cynthia还住在学生合租房)。John发现自己是真的深深恋爱了,写了这首歌,并在厕所里录了demo(demo结尾有冲水声)。歌词可能受启发于1937年白雪公主与七个小矮人的唱段l‘m wishing,词差不多。George 后来说曲子是启发自Stereo乐队的I really love you. 虽然是John自己写的歌,但录音时候是给George唱了,John说,因为George唱歌水平也就那样,这歌只有三个音,就很适合他。

there’s a place: John写的歌主题总围绕着孤独与被拒绝,或者是梦与回忆。这首歌属于后者。John声称是自己写的,Paul说主意是他看西区故事里的There’s a place for us启发的。总之,John承认旋律借鉴了底特律的Motown摩城唱片的标志性律动黑人音乐。Beatles是摩城的狂热粉丝,翻唱过很多首摩城出品的歌(比如please mr postman),这些歌的火爆夜翻过来拉动了摩城的知名度。

Show thread

我校把邓中翰聘来当我院院长了,当然估计只是挂名,有这钱硬是不愿意改善学生生活和教学质量,非要搞这种聘任院士当挂名院长的形式……

(在中国做IC Design的一个很微妙的地方是中国芯片承载了太多技术之外微妙的东西了……技术是一方面,另一方面这个行业内的patriotism浓度高到令人无法容忍……每一款国产芯片都必定一大半的文宣都在讲“中国芯”“国家发展趋势”“卡脖子”这种的废话来吸引投资……行业泡沫大得离谱……我实在受不了这种风气准备跑了)

转码选手在看job description时经常会遇到要求各种各样的工具,自己没用过就会胆怯,实际上这些工具可能很快就能学会(比data structure/algorithms要容易得多),推荐一下这个课程

计算机教育中缺失的一课
The Missing Semester of Your CS Education 中文版

大学里的计算机课程通常专注于讲授从操作系统到机器学习这些学院派的课程或主题,而对于如何精通工具这一主题则往往会留给学生自行探索。在这个系列课程中,我们讲授命令行、强大的文本编辑器的使用、使用版本控制系统提供的多种特性等等。学生在他们受教育阶段就会和这些工具朝夕相处(在他们的职业生涯中更是这样)。 因此,花时间打磨使用这些工具的能力并能够最终熟练地、流畅地使用它们是非常有必要的。

missing-semester-cn.github.io/

也有YouTube频道:
youtube.com/playlist?list=PLyz

最近忙起来就没空写音乐记录了,试着在忙的时候用这个30day playlist替代一下,有空再系统推专辑。
那么Day1,一首歌名里带有颜色的歌:

Red Right Hand - Nick Cave & The Bad Seeds;
White Light/White Heat - The Velvet Underground;
Blue Monday - New Order;
Fade to Grey - Visage;(新浪潮代表作,但很显然同样是fade to,后面这首更有名)
Fade to Black - Metallica;
Yellow - Coldplay;
Yellow Submarine - The Beatles;
The Court of the Crimson King - King Crimson;
红 - 张国荣;
禁色 - 达明一派。

想建一个机器学习相关的讨论组,微信群/tg/discord都可以,目前看起来discord最好不过翻墙会一定程度影响交流,大佬小白愿意来的都可以,可以讨论技术也可以聊八卦,三人就可以成群,现在已经有我和 @FLUCarrier 还有人要一起加入吗?

朋友本科毕业不想读研了,最近在找工作,拿了阿里和字节的offer,正在面微软。然后阿里今天联系她,给她开了28k*16的大sp,5w签字费,房补另算,要求今明两天签好。。我:你这还读个屁研面个屁试。。。。苦涩,果然只要够强,在哪里都是一样吃好喝好

Show older
SCI小卖部(๑╹ヮ╹๑)ノ打折啦

SCI站是学术奇思妙想所创造的空间,初衷是为饱受学术之苦的小象们创造一块自留地,能够分享学术时期的心路历程从而互相安慰与互相鼓励。同时我们也欢迎所有朋友加入我们一起碎碎念,让小象们的生活哲学能够交融于此。