全是想念r语⾔计算某个字符串中某个字符数量_2020.09.25“这周学了
啥?”“R语⾔可太好玩了”...
统计基础--R:
安装和启动⽐spss快很多。
上课时,⽼师:“先不下R studio了,这个初学够⽤。”
哈哈哈哈哈好的。陈立生
程序可以不难学,反正我不太喜欢上来就搞最难的,零基础⼩⽩菜得安详。
哎呀,这个课⽼师真的超可爱,先介绍了“R当计算器⽐电脑⾃带的好⽤多了!”,安利了⼀波计算器使⽤⽅法,像极了分享⾃⼰宝贝玩具的⼤男孩。
R当做计算器也的确简单。把脑⼦⾥想的数学公式打进去按回车就⾏了。
数学函数表⽰⽅式可能得查⼀下。百度必应⾕歌,⼀搜解千愁。
一天一斤减肥法常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.
说起来这些对我来说也不常⽤,⽤不到的知识⼜增加了
好了,
1、基础概念之向量,Vectors:【向量是⼀串有序数据,向量内】
R⾥vectors分三种,数值、逻辑值、字符串,英⽂分别是
Numeric vectors
Logical vectors
Character vectors。
mode(x)语句可查看哪⼀类。
R⾥的向量表⽰⽅式:
输⼊数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")
逻辑值按回车后可判断正误,true fal,或者NA(not available)。
2、变量、变量名、赋值
变量,咋说呢,定义是“A variable is ud to store information”,反正就指代某⼀⼤串信息。
接下来,给变量起名字,并赋值。起名字有讲究的。
英语词语
对了,打字之前,先知道⼀句R对⼤⼩写敏感(⼤⼩写敏感是说,⼤写⼩写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。
起名字的规矩其实就三条:
1、可以有√:A-Z, a-z, 0-9, 英⽂句号 (.) 下划线 (_)
2、不能有×:空格,rerved keywords
3、开头只能是字母或点
(保留字是啥之后再说叭,今天⽤不到)
好了,现在已经会起名字了。再也不怕变量太多分不清了
那开始把名字和数据配配对。
赋值符号 :"
x=2, x
在R看来⼀个意思。
那怎么告诉它我想要的是“x⼩于负⼆”?
加空格。x< -2
是不是很妙
3、基础操作:
单独拎出来对⼩⽩最重要的:Help
想⼲啥--中⽂描述需求进⾏百度或⾕歌--得到某个函数语句。忘记某个语句⽤法可以直接在R内⽤
'['
查询。这个查询是本地的。当然,能不能看懂另说,反正我是有些看不⼤懂本地这个help(捂脸哭),是百度⾕歌CSDN等论坛经验帖们救了我的作业。
以下是好玩的语句们:
(1)length(x)看向量多长
繁体字古诗
这个长度很有意思。
可以直接改变x长度,强⾏暴⼒延长或者截断。延长的部分没有东西,就⽆法获取了,显⽰为NA,not available。啊,⽽且这⾥是直接对x进⾏了改变诶。对⽐替换函数gsub,这个改变就很有意思。
length():
hbo节目表
gsub():把Y替换为空字符,在X中。
telent
替换时可以替换为空字符,即''。
关保空字符是个我之前没有的概念,还是做作业时群⾥同学讨论,⽼师提了句我才发现的哈哈哈哈哈。班群讨论氛围很好,⽼师也很耐⼼,开⼼。
(2)R如何提取某串数据⾥的数据?
tips:
a:对⽐两种括号的不同:“[ ]”⽅括号表⽰拎出来哪个东西(extract)。
b:图上后两⾏表述⽅式等价。
c:观察可发现可以乱序拎出数据、重复拎出、不要某个东西后拎出(-表⽰)并按顺序排列。
如图,这些操作只是拎出来,并没有改变x。
(3)paste 是⼲啥的?
如果俩元素数量不等呢?NA么?还是怎么整?
循环⼀下,这时候就不是NA了。
4、逻辑值向量的逻辑操作符号:
>, =, <=, !=(不等于)
& (and)
| (or)
好滴。知道这些就可以写今天的作业啦
⽼师ppt的⼩作业。
本来觉得看起来好简单,半个⼩时还不得搞定么,真做起来,琢磨规则⽤法搞了三个⼩时。
⾏叭。
text1 = "China's Jade Rabbit moon rover has endured a long lunar night but is still malfunctioning, state media said on Thursday, after technical problems last month cast uncertainty over the country's first moon landing.”
text2 = "Jade Rabbit, named after a lunar goddess in traditional Chine mythology, landed to domestic fanfare in mid-December, on a mission to do geological surveys and hunt natural resources."
Question: (1)how many characters are there in Text1?
(2)how many unique words are there in both Text1 and Text2?
R对我这种⼩⽩,有趣的点在规则未知和摸索,在“想知道什么--去检索⽤法--不断试错并得到反馈,再调整”,中间有许多次“我觉得这次⼀定没问题”,但结果错了的假·“啊哈时刻”,有许多次“原来如此”和“还能这么搞”的奇妙。
最后捣⿎出来还是开⼼的,哪怕语句多次套娃。
过程波折但能⾛下来,是因为有很多经验帖,也有好友在线答疑,知道去哪⾥找答案。