往前走

体温还是比日常量的低零点几个数,鼻子也还在塞。脖颈也异常的怕冷起来,坐在室内也要带着围巾,不然寒意逼人。做事的效率也尚未恢复,原本应该在12月完成的项目,着急赶工,却怎么也走不快。

无论如何,毕竟是在往前走了。

在2023年的第五天,写下今年的resolution:

  1. 要健康:更专业有效地锻炼,瑜伽+有氧+营养。
  2. 无论多忙,坚持工作之外的学习。
  3. 用更平和全面的心态去看待工作中的人和事。
  4. 即使不能每天reflect,最少也要每周。
  5. 时间框架3+5+2
  6. 重读计划:在这一年里,重读书架上的所有书籍。送出一本,才能买新的。

Happy New Year

缠绵病榻两个多星期,跨年的庄重和仪式感显得无足轻重。

起初觉得自己尚属幸运,症状并没有网上诸君那样剧烈。后来烧到头痛欲裂,睡不着站不起,鼻子呼吸不通半夜窒息醒来……

所幸刚开始感觉不对劲的时候,在小米商城闪送了温湿度检测仪,发现房间温度在20以上湿度40左右的时候,体感会稍微舒服点。看来楼下阿姨四月里“只是嗓子有点痒”的症状,跟气候是有些关系的。

整个过程最高烧到39.2°,谨遵医嘱地在量出38.5°之上吃芬必得两片,前后间隔6小时。

嗓子痛时吃了一次蒲地蓝,吃了之后身体发冷,虽然嗓子和鼻子症状都有缓解,后边没敢再吃。

洗鼻盐已经过期,但新买的尚未到货,所以还是洗了若干次。对鼻塞有治标不治本的缓解作用。

鼻子还在时不时地封住,精神力气尚未恢复,皮肤变得干痒,胃口欠佳又容易感觉到肚子饿……

微博上三年前因为武汉数据统计关注的朋友,记录着为家里人奔走谋床位的事。当初发现他们已经在做自己准备做的事情的时候,心里是欣慰的,感觉有人在默默地脚踏实地做对的事……而今也是无能为力的黯然。

能够平安地捱过这一遭,大概真算是幸运的了。

新的一年,虽然不能把所有的苦难抛到脑后,但经过了上一个四五月的无力、十二月的病痛,总可以对新年说,我会善待一切包括自己,尽力地过好每一天!

Happy New Year!

Metrics

最近意识到的,不仅仅是工作和数据分析中可以用tasks和metrics来构建发现和决策的框架。日常生活里也有用的。

反反复复地发烧咳嗽咽痛,用上体温指标,早中晚判断要不要吃退烧药,再听医生建议取消剧烈运动就可以了。抗不抗原的,似乎都没有多重要了。

想要购买某物,先看对目前状况的改善程度有多大,再检查是否已有其他可代替物品——若是两项发现确定不需要之后还买,就无疑是饕餮贪婪。

病中对自己也有了更多的反思。

  1. 某一整天的卧床之际,看到一位前辈确诊之后依然在固定的时间完成每日例行的事项。而自己,既没有持续的高烧,也没有强烈的症状,见贤思齐之下,连年纪大了的玩笑也不好意思说出口了。
  2. 学习和锻炼,大脑和身体是有细微变化的。停掉瑜伽的当周,静息心率就+2了。所以还是要坚持有效的学和练,即使有时候感觉看不到变化。
  3. 很多的物欲,是没有必要的。费时费力又费钱之后,不过是给自己背上无用的负担罢了。

笔记:数据清理验证清单

数据验证是一个确认数据清理工作执行良好、结果数据准确可靠的过程。没有验证,就不能确定你的见解在数据驱动的决策中是否可以被信赖。

每个项目都有独特的组织和数据需求,所以有必要运行特有的清单进行验证。但无论项目和工具为何,均可参考以下清单。

1、确保发现了最常见的问题并加以纠正,包括:
1) 错误来源:是否使用了正确的工具和函数来查找数据集中的错误来源?
2) 空数据:是否使用条件格式和过滤器搜索null?
3) 拼写错误的单词:找到所有的拼写错误了吗?
4) 数字输入错误:是否再次检查的数字数据是否输入正确?
5) 额外的空格和字符:是否使用TRIM功能删除了任何额外的空格或字符?
6) 重复:是否使用删除重复功能或在SQL中删除电子表格中的重复?
7) 不匹配的数据类型:是否检查了数字、日期和字符串数据的类型转换正确?
8) 凌乱(不一致)的字符串:是否确保所有的字符串都是一致且有意义的?
9) 凌乱的(不一致的)日期格式:的数据集的日期格式一致吗?
10) 误导变量标签(列):的列的名字有意义吗?
11) 删节数据:是否检查过截断或缺失的数据需要更正?
12) 业务逻辑:是否根据对业务的了解,检查了数据的意义?

2、一旦完成了数据清理任务,最好检查一下项目的目标,并确认数据仍然与目标一致:
1) Confirm the business problem确认业务问题
2) Confirm the goal of the project确定项目目标
3) 验证数据可以解决问题,并与目标一致
当接收到更多的数据或对项目目标有了更好的理解时,可能需要重新回顾这些步骤的一部分或全部。这是一个贯穿于整个项目的持续过程。

另,清理过程中的变更日志非常非常重要。

跬步

大概这世间的许多道理,都是相通的。

荀子在劝学里说,不积跬步无以至千里,不积小流无以成江海。今天做事时,脑子里突然冒出这段话来,于彼时的情形,恰如其分,毫厘不爽。

看似简单的小细节,项目开始之初就得严格地定义和执行。执行好了,丝滑得感觉不到它的存在;执行不好,不仅返工浪费时间,还容易出现混乱和错误。更重要的是,极有可能打击自己和团队对数据的信心。

从一开始就要保持数据的井井有条!制定数据生命周期SOP流程:

1、命名规则:内容_日期_版本号v01
2、文件夹规则,并分ongoing和archive
3、存放地有效性
4、修改权限问题
5、align元数据文档和数据层级架构
待续……

感觉突然蹦出的想法有时候就像潜意识抛出的锦囊,值得停下来仔细思考和记录。

另外,小时候背的书还是有用的啊,一不小心就是一个哲理的chunk。

艾灸使人发困,具体的条目明天再想吧。