Finisky Garden

NLP, 软件工程, 产品设计

今天来聊聊老板喜欢什么样的下属。这个问题其实因老板而异,工作这些年见过各种风格的老板,但不论什么风格,靠谱和有能力的下属都是重点培养对象。我们先从老板的角度,简单分析下作为下属可以从哪些方面提升这些能力。

阅读全文 »

I bind a custom domain finisky.eu.org to the github pages finisky.github.io and then remove it. However, when I visit finisky.github.io, it always redirects to finisky.eu.org which is unavailable. I suspect the issue is caused by cache.

阅读全文 »

Knowledge Grounded Conversation (KGC),就是基于知识的对话生成,与不使用知识的对话生成相比,生成的回复更有信息量,可更好地与用户互动。

本文不是KGC的综述,所谓漫谈,则是比较随性地聊聊这个方向的代表工作,顺带简单梳理其发展脉络。

阅读全文 »

之前 WeLM的文章 探讨了微信大语言模型的原理。同时,WeLM开放了API:https://welm.weixin.qq.com/docs/api/ ,有幸申请到了API Token,将其接入了微信公众号Finisky Garden,聊天机器人取名小菲,大家可以来试试~

阅读全文 »

一个看着非常简单的App:手机敲木鱼,居然能在App Store上评分4.8,十几万的评论,还有App内购买赚钱,刷新认知不?

这年头多少人绞尽脑汁做App都无人理睬,反倒被这么个极简的玩意儿割了韭菜,原因还是它抓住了用户的痛点。

阅读全文 »

Google今年发布的聊天机器人LaMDA确实惊艳,之前一个Google员工与它对话后,声称它已经有了自我意识,还上了热搜。今天就来看看这机器人背后的原理是什么。

关键词: 大模型,高质量人工标注数据。

LaMDA: Language Models for Dialog Applications

论文的标题很大,有50多个作者,挺有意思。

阅读全文 »

今天来看看这篇 ACL2022 的文章:

[ACL2022] Leveraging Similar Users for Personalized Language Modeling with Limited Data

解决的问题很容易理解,个性化语言模型在用户刚加入时缺少数据的冷启动问题:

Personalized language models are designed and trained to capture language patterns specific to individual users.

However, when a new user joins a platform and not enough text is available, it is harder to build effective personalized language models.

思路也比较直接,使用新用户的少量数据在已有用户中找到相似的用户,然后用相似用户的数据进行语言模型的训练,从而解决数据稀疏的问题。

实验论文,提出了三种不同的指标来进行用户相似度计算,实验证明 user embedding + interpolate model效果最好。

阅读全文 »

开卷有益是一个成语,最早出自《与子俨等疏》。 意思是读书总有益处。常用以勉励人们勤奋好学,多读书就会受益。

现在这年头,出书不要太容易,烂书也是出奇的多,开卷有益这词儿已经不适用了。就随口说说我最近翻过的几本烂书:《断舍离》,《组织的力量》,《底层逻辑》。

阅读全文 »
0%