Leave the Second Job

2024-09-10 21:08:51 · 0 min · Eddie Wang

Windows安装Tesserocr

安装tesserocr-windows_build 到tesserocr-windows_build release页面下载对应的whl文件 如下载 tesserocr-2.6.2-cp312-cp312-win_amd64.whl, 下载之后用pip安装 pip install tesserocr-2.6.2-cp312-cp312-win_amd64.whl 安装ocr windows exe程序 在这个页面,有对应的exe程序,https://digi.bib.uni-mannheim.de/tesseract/ 例如下载这个exe文件 https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.3.0.20221214.exe 下载完成之后点击安装,一般我们不需要修改他的安装位置,默认的安装位置是C:\Program Files\Tesseract-OCR 我们将C:\Program Files\Tesseract-OCR\tessdata下的所有文件,复制到C:\Program Files\Tesseract-OCR\目录下 参考 https://github.com/simonflueckiger/tesserocr-windows_build/releases https://digi.bib.uni-mannheim.de/tesseract/ https://tesseract-ocr.github.io/tessdoc/Downloads.html https://blog.csdn.net/Yuyh131/article/details/103880585

2024-04-24 08:34:07 · 1 min · Eddie Wang

Default

2024-04-24 08:32:57 · 0 min · Eddie Wang

使用Excel理解prometheus的变化率相关函数

counter类型的变化率 rate, irate, increase counter类型一般是只增不减的累积值,例如系统累计的http请求数量, 累计的话单数量。 counter类型的指标变化率一般使用三个函数来计算,rate, irate, increase 指标每隔15s采样一次数据, A列是采集的指标值,B列是对应的采集时间。 demo_api_request_duration_seconds_count{instance="demo-service-0:10000",path="/api/bar",status="200",method="GET"}[1m] 序号 A B 1 294401976 1710549816.105 2 294402185 1710549831.105 3 294402393 1710549846.105 4 294402599 1710549861.105 rate是计算每秒的变化率, rate 计算方案 (A4-A1) / (B4-B1), 这里选择了首尾两个值的差值,除以时长秒 irate 计算方案 (A4-A3) / (B4-B3) , 这里只选择里最后两个点的差值,除以时长秒 increase 计算方式 (A4-A1) / (B4-B1) * 60, 这里的60是1m, 其实increase就是rate() * windows_seconds的语法糖 guage 296164749 @1710648381.105 296165055 @1710648396.105 296165364 @1710648411.105 296165668 @1710648426.105 296165978 @1710648441.105 296166186 @1710648456.105 296166505 @1710648471.105 296166826 @1710648486.105 296167151 @1710648501....

2024-03-16 08:38:46 · 1 min · Eddie Wang

什么时候应该使用ts范型?

我知道ts支持范型,但是因为几乎用不到,所以对于范型对我来说往往蒙上一层神秘色彩。 最近我才真正的体会到范型的真正威力。 下面就介绍我的使用场景。 在和后端接口交互的时候, 后端接口返回的数据都是如下的类型。 interface XData { success: boolean total: number result: any[] } 这里我把result定义为any类型,因为它的具体类型是由接口确定的。 比如查话单的接口是话单的结构类型,查订单的接口返回的是订单的类型。 interface CDR { id: number creatAt: string } interface Order { id: number } 在不用范型的时候,我们要么定义如下两个interface interface XDataCDR { success: boolean total: number result: CDR[] } interface XDataOrder { success: boolean total: number result: Order[] } 在使用axios的时候,对于响应体的data, 可以使用如下的方式声明data function getCDR (id) { return axios.get<XDataCDR>('/api/xxx' + id) } 但是,如果我们稍微修改一下XData的类型声明,加上范型。 就不需要用到XDataCDR和XDataOrder两个接口。 interface XData<T> { success: boolean total: number result: T[] } function getCDR (id) { return axios....

2023-12-28 20:21:11 · 1 min · Eddie Wang

使用bun加速开发环境的ts编写

前言 最近我在开发一个demo程序,为了加速开发,我觉得直接用js要比用typescript更快,而且这只是一个demo程序,杀鸡焉用牛刀。 而且一旦我要用typescript开发,避免不了要各种配置,例如typescript, ts-node, nodemon之类的,很是繁琐。而且ts也必须要经过编译后才能运行。 然而,直到遇到一个bug, 我排查了半天,才发现是一个对象的属性写错了。本身这个对象是没有这个属性的,js没有任何错误提示。我只能一步一步缩小代码的范围,最终才定位到是属性拼写的错误。 这个拼写的错误,应该是vscode的智能补全,给出的提示词,我直接回车确认了。 这件事给我一个教训:以后所有代码都要用ts去编写。 直接用js去编写虽然看起来写的快,但是代码调试太痛苦了。 这种拼写错误,ts的智能提示会直接告诉你错误的地方,但是如果去排查js文件,花费的时间是无法估量的。 但是我又不太想去配置各种ts的执行环境,就想起来之前曾经用的bun这个ts执行工具。 虽然bun这个工具才刚刚发布1.0版本,但是在开发环境使用也是足够了。 我的设想是在开发环境用bun, 在生产环境用nodejs执行bun编译后的js代码。 这个demo程序用bun去运行的时候,没发现任何兼容问题。 这也让我有了继续研究下去的信心。 bun的开发环境 我之前看过deno, 但是看多deno的官方文档后,发现并不符合我的胃口。 但是bun的文档写的很好。 任何工具的第一步都是安装,但是bun似乎在windows上执行并不太好,所以我是用windows的linux子系统,或者在mac上安装的bun。 具体的安装步骤可以参考,https://bun.sh/docs/installation 项目初始化 bun init bun init helps you get started with a minimal project and tries to guess sensible defaults. Press ^C anytime to quit. package name (quickstart): entry point (index.ts): Done! A package.json file was saved in the current directory. + index.ts + .gitignore + tsconfig.json (for editor auto-complete) + README....

2023-12-23 15:04:44 · 1 min · Eddie Wang

算法 - 入侵脑细胞

我以前看过一部电影,叫做《入侵脑细胞》,这部电影提供一种可能性。类似的电影还有《盗梦空间》,都是将一种思想植入别人的思想中。 这两部电影虽然提供了可能性,但是却无法提供实际可操作的方案。 最近在阅读的一本书也于此有关,叫做《对不起,我操控了你的大脑》,是一个叫做剑桥分析、曾轰动世界的公司,利用基于大数据、算法、人工智能、心理学来做思想植入的。常见的领域如操纵大选,并且提供成功的案例。 但是作为普通人,大规模的思想植入似乎里我们还是比较遥远。 但是真的那么遥远吗? 昨天我爸来看我,之前他总是抱怨手机流量不够用。我给他换了每个月180G的流量卡,才过没两三天,他说已经用了20多G了。按照这个速度,180G的流量也不够用一个月。 我问:“你怎么会用那么多流量!,你用手机看视频的吗?” 爸说:“我经常刷抖音,刷好久,刷的眼疼” 我说:“你还是少刷点手机吧”,虽然这只是苍白无力的 一句关心。 我爸生于70年代,没怎么读过书,小学文凭。现在年近五十,经常带着鸭舌帽,依然遮不住后脑勺斑白的头发。虽然他经常用手机,但是很多东西依然搞不明白,需要找身边的年轻人来帮忙设置手机。 一个50多岁的人,人生过了大半。面对现在飞速发展的社会,很多东西都已经无法适应。对于他自己来说,也基本上无法改变自己。从第七次人口普查的数据中可以看出,在2020年60+的人口已经占比接近14亿人口的20%了,随着时间的推移,这个占比只会增大。 对于我爸这类的人,即使刷的眼睛疼,也无法控制自己,还是一直不停的刷。 由此可见,像这种大公司,制作的超级App有多可怕。能够一直持续的让大脑保持短期兴奋。这种超级App,背后都是心理学家、计算机学家、数据科学家等。 这些专家对待普通大众,就像哥伦布对待印第安人。 因为我发现他们没有什么信仰,也没有任何崇拜的形象,人们又都很温和,他们无邪得不知道什么是邪恶,从不侵害别人,也不懂得偷窃,没有打斗,特别的温顺 《哥伦布日记》 或许几十年以后,大部分人的大脑已经退化,也不需要有思考能里。只需要机械的按照刺激->反应去行动。 这种进化是一种潮流,绝大多数人都难以幸免。作为一个独立思考的人,我只能尽量避免被影响,远离社交网络。

2023-11-21 20:35:02 · 1 min · Eddie Wang

解决 VsCode pwsh终端环境变量不生效问题

我在系统的环境变量设置里,用户和系统中,都加入了ELECTRON_MIRROR=https://npmmirror.com/mirrors/electron/这个环境变量。 单独打开windows Terminal应用,使用 env | grep ELE 是能搜到我设置的环境变量的。但是在vscode中,这个环境变量不存在。 我尝试了以下几个方法 重启电脑,无效 配置"terminal.integrated.persistentSessionReviveProcess": "never", 然后重启电脑,无效 在终端直接执行code ., 在终端打开vscode, 依然无效 因此,我想起了之前配置的pwsh的配置文件。 可以使用code $PROFILE, 打开pwsh的配置文件。 然后再配置文件中设置环境变量, 之后重启vscode, 环境变量就正常能读取到了。 # 文件名 Microsoft.PowerShell_profile.ps1 $env:ELECTRON_MIRROR="https://npmmirror.com/mirrors/electron/" 参考 https://www.zhihu.com/question/266858097

2023-11-16 08:08:39 · 1 min · Eddie Wang

如何选择,汉王Clear7与文石Leaf3

购买选择 我的kindle pw4已经用了快三年了,机器性能有些不足,电池也有些不够用了。正逢双十一之际,我觉得可以买一个开放系统的电纸书来用用。 买开放系统的另一个原因是自从亚马逊退出中国后,我用微信读书比较多,也买了微信读书的会员。 开放系统基本上都是基于安卓系统定制的,可以选择的厂商比较多。 最终筛选下来,我选择了汉王clear7和文石leaf3, 我下单了两个,觉得先体验一下,然后在退一个。 然而用了不到两天之后,我还是决定把两个机器都给退了,继续用我的kindle pw4。 选择因素 就我个人而言,电子书最为重要的选择因素有以下三点。 显示效果: 说实在的,现在的电子书基本上都是carta1200、300ppi、冷暖光。基本上从显示效果上来说,各大厂家都是半斤八两。就我自己体验而言,我并没有发现汉王的显示效果和文石leaf3有何不同。 握持手感: 外观影响握持手感,外观一般分为两类,一类是就是平板设计,像kindle paperwhite系列。另一类就是书脊式设计,握持更舒适,像kindle os3, 汉王clear7之类的。 简洁系统: 电子书并不是手机,不需要太多的功能,功能太多反而成为累赘 稳定性: 点子产品难免被摔、或者淋水,对于这些意外情况,如果产品非常脆弱,那么很大可能会损失大笔的金额。 续航 文石的缺点 文石和汉王的两款产品,拿到手开机不到一小时,我就决定先退了文石。 原因有以下几点 显示效果文石和汉王差不多,没啥突出亮点 握持手感文石肯定比不过汉王的书脊式设计, 并且汉王更轻 文石的系统太复杂,设置太多,甚至还有个iphone类似的小白点设计,小白点点击之后展开很多图标,每个图标我都不知道做什么的 掉电速度,文石的电量肉眼可见的在不断减少 汉王的缺点 微信读书功能阉割, 这不是汉王的问题,而是微信读书自身的问题。例如书架页面,书籍只有一个排序的顺序,就是按照最近阅读的排序。而无法像ios或者安卓app一样能够按照阅读进度排序,另外也没有阅读时长分析的功能。 另外我也注意到,微信读书电纸书版,扫码登录的有效期是24小时,我不知道这是不是意味着24小时之后我又要重新扫码。 触感光滑,汉王的背板的触感让人感觉非常光滑,感觉稍不注意就会滑下去的样子。完全没有kindle pw4那种拿在手机,就粘在手上的感觉。所以我觉得,买汉王,就必须要买一个保护套,但是官方卖的保护套也太贵了吧,居然要110多块,这点有点像割韭菜。什么保护套能卖那么贵,都快赶上十分之一的电纸书的价格了。 词典缺陷,汉王的词典也是我要吐槽的功能之一,只能把单词的原型加入到单词本,单词来个复数或者过去分词,就不能加入单词本了。kindle的生词本,所有单词,无论什么形式都能加入单词本。 掉电速度, 从昨晚五点多开机,到今天早上,基本上没到一天,电池已经掉电接近40%了 自动关机, 为了省电,汉王在2小时不使用后,会自动关机。然而这个开机时间就有点久,你可设想一下,每天早上,你想看书的时候,你都要等几十秒的开机时间,那你能受得了吗? 按钮反馈,松松垮垮, 触感没有一致性体验 结论 目前而言,国产的电纸书系统,除了开放的系统之外,其他各个方面还是存在与kindle有较大的差距。 当然,如果你从未使用过kindle系列的产品,国产的电纸书还是值得买的。

2023-11-06 09:30:34 · 1 min · Eddie Wang

没有免费的Obsidian

我看过很多介绍obsidian的文章,除了外观漂亮,功能强大,最为着重前调的就是个人用户免费了。 对于个人用户,真的免费吗? 还是说人家并不是免费,只是我们在白嫖罢了。 我们看看官网关于商业付费的详细解释: Obsidian 对于个人是免费的。但是,对于那些拥有两名及以上员工的公司或组织,以商业目的使用 Obsidian 的话,则需要购买商用许可证。所谓商业目的,指的是任何与工作相关的活动,比如记录会议内容、项目笔记,或是创建组织 Wiki 等。与这些活动相关的笔记记录、文档管理、知识管理等都可以视为以商用目的使用 Obsidian。 –参考商用许可证 所以,大部分人,包括我都是听话一半,只看前面,不看后面的但是。 对于大部分上班族来说,如果你再用obsidian,我不太相信你从来没有在obsidian里记录一些工作内容。 对我个人来说,虽然我的有几百条笔记和工作无关。但是也免不了有一些是和工作有关的的。比如对于某个线上问题的分析,比如记录了一些工作账号信息等等。 在关于商业付费的例子上,官方还举出了贴心的给出了栗子。 问题5:我使用 Obsidian 储存所有的知识,无论是个人的还是工作/专业相关的(因为太难区分),我需要购买商用许可证吗? 回答:如果你的笔记中有内容直接与公司项目相关,并且该公司拥有两名及以上员工,那么你需要购买商用许可证。 综上所述,即使是个人使用,免费的条件也是极为苛刻的。 你的笔记不能包含任何商业目的的信息 你可以包含商业目的的信息,但前提是你的公司只有你一个人 假如你是个用Obisian的上班族,我觉得极大的可能你并不符合免费用户的条件。 或者有一天,当你大学毕业了,进入工作环境,你如果还继续用之前的仓库,那你也不再符合免费用户的条件。 所以说,不要再逢人就说Obsidian是免费的了。 Obsidian并不免费,只是我们大部分人都在白嫖罢了。 我也并不是不愿意花钱,如果要付钱的话,我更想买typeora。 因为typeora是买断机制,一次性付费89元,终身包用,免费升级,最多可以再三台设备上使用 Obsidian是订阅机制,每年商业使用要50美元,也就是将近400人民币。

2023-10-25 16:39:10 · 1 min · Eddie Wang