2024.03.07_学习日记
天气:雨
学习地点:学校
学习时长:7h
学习内容
- 论文
可以用年报文本分析法和年报财务数据相结合的方法,我国上市公司自2007年开始实施新会计准则,故而研究样本时间设定为2007—2022年。其一,将银行、证券、保险等金融行业相关上市公司进行剔除;其二,对研究样本时期内有过ST特殊处理、退市等非正常上市状态的公司样本进行剔除;其三,将上市公司IPO所在的当年样本进行剔除;其四,在进行上述样本筛选步骤的基础上保留具有连续三年及以上研究样本的上市公司以提升计量研究效率。此外,为了减缓样本异常值的潜在扰动,对计量检验所涉及的所有连续型变量按1%和99%水平进行缩尾处理。 - 爬虫源码,词频统计jieba.py里。
正则表达式,提取年报MD&A部分。 - lc322
完全背包问题,当前位置取或者不取,取的话是dp[i][rest-coins[i]],不取的话是dp[i+1][rest],然后对比最大值,初始化的时候全设置成inf,这个题要用动态规划和滚动数组优化。 - lc84
两个解法。首先想到i位置最大矩形,就是i位置左右两边第一个比它小的位置中间这一段乘以i的高度,所以就是找到每个位置左右两边第一个比当前位置小的值就行,用两个数组,left数组表示当前位置左边第一个比它小的位置,用一个while循环一下就行,right同理,从右往左循环,left左往右,最后用res算出最大值。
另一个解法是用单调栈,从左往右每次遇到比栈顶小的值时就用计算要弹出的这个栈顶的res值,栈顶下面的值就是左边界,遍历到的值就是右边界,所以能直接算出res值,然后当前元素入栈,遍历完救能得到最大值。