LAB4--Interpreter Lifesaver
The objective is to read commands from a txt file, parse these commands and output the results line by line. Just like what MATLAB does.
写在前面
首先不要被interpreter吓到,这只是一个功能基本的小程序,远没有到写编译器(compiler)的程度!不要慌,这是可以实现的!
整个实现过程是由小到大,由少到多的,基本流程如下:
- 实现读写数据
- 实现逆波兰加减乘除
- 实现逆波兰括号
- 实现逆波兰式完整转化
- 实现分割操作符与操作数
- 实现逆波兰式的计算
- 实现对负数的识别与计算
- 实现对任意表达式的计算(Milestone)
- 实现变量赋值式的转化
- 实现变量的识别
- 实现变量的数值存储与使用
- 实现有变量式子的计算
- 实现变量值变化后式子的计算
- 实现分号功能
- 通过JOJ!
然而本文档并不会每一步给出指导(懒)只会给出一些关键问题的解答,如果还有疑惑,请首先使用你的大脑,再使用搜索引擎,再使用TA,最后使用你的倒霉室友。
注:本文档中的大部分代码是伪代码(seudo code),仅作为基本的示范,不可直接复制黏贴!请你理解后模仿写出属于自己的代码!
stack的操作与定义
栈的性质
栈是一种特殊的数组,数组中的元素先进后出,后进先出,可以类比为一个羽毛球桶,先进去的羽毛球最后面才能拿出来。为了体现“先进后出,后进先出”的重要特性,我们规定push与pop两种操作。push将元素塞入数组最上方,pop将数组最上方的元素弹走。
push(压栈)pop(弹栈):
1 | int push(char *stack, int top, char element); // push char |
考虑到pop与push均为栈的常用操作,因此通过自定义函数来实现。
自定义时注意以下三点:
pop/push完后,top在哪?pop/push的对象元素是谁?pop/push的目标数组是谁?- 栈的数据类型?
- 将以上问题的答案作为你的函数参数/输出。
Sample Code:
1 | int push(char *stack, int top, char input){ |
自定义好stack操作函数后,开一个新的practice.c
熟练你的stack操作!
修改自己的pop与push函数,使其符合自己的思维习惯与逻辑。
注意:只有你知道你的stack应该怎么操作!
Sample Code:
1 |
|
stack在逆波兰表达式中的实战
逆波兰表达式RPE(Reverse Polish Expression)
毫无疑问,lab4的description在放屁。如果你仍然对RPE有不解之处,或者你无法熟练地人工写出一个正常表达式的逆波兰表达式,请你先理解逆波兰表达式的操作后再开始coding!
逆波兰表达式由某个波兰人发明,由于发明者名字太难读,所以取名“Polish”。逆波兰表达式的本质是将一个中缀表达式(infix),i.e.操作符(operator)前后连接两个操作数(operand)(e.g. (0 /a+ 0 / 1+ 0/3 + 0/a + b * 2.5)* b^(-2))变为后缀表达式(postfix),i.e.,操作符在操作数的后面 (e.g. ,0,a,/,0,1,/,+,0,3,/,+,0,a,/,+,b,2.5,,+,b,0,2,-,^,)由此便可以通过栈的数据结构便于计算机的运算与操作。
逆波兰表达式的转化
预备工作
要实现逆波兰表达式的转换,你需要三个数组:
- 待转换式子的数组
infix - 放符号的load栈
load_stack print最终转换后结果的输出栈RPE
开始转换
从左至右扫描中缀表达式。
遇到操作数时,将其压入转换后结果的输出栈RPE。
遇到运算符时,比较其与
load_stack栈顶运算符的优先级:
如果
load_stack为空,或栈顶运算符为左括号(,则直接将此运算符入栈。否则,若优先级小于或等于栈顶运算符优先级,将
load_stack栈顶的运算符弹出并压入到RPE中。将当前运算符压入栈中load_stack中再次转到 1 与
load_stack中新的栈顶运算符相比较。
遇到括号时:
如果是左括号
(,则直接压入load_stack。如果是右括号
),则依次弹出load_stack栈顶的运算符,并压入RPE,直到遇到左括号为止,此时将这一对括号丢弃; 重复步骤2至5,直到表达式的最右边。将
load_stack中剩余的运算符依次弹出并压入RPE。
整个流程都非常抽象,表格法并不直观。所以强烈建议看视频或者动图进行直观理解。
可参考资源:
https://blog.csdn.net/yuan_xw/article/details/104436091
https://youtu.be/7ha78yWRDlE
完美的逆波兰表达式应该只有数字与加减乘除等,没有括号!
实现
在基本理解转换过程后,拿几个式子进行人工计算!可用这个网站https://www.mathblog.dk/tools/infix-postfix-converter/ 进行检验。
感觉自己基本掌握了之后,就开始coding吧!
在转换之前,请你首先解决这个不难但是总是实现不了的问题:
如何将读写txt文本的数据?
- 推荐以下函数:
fopen(), feof() ,fgets()
他们的具体功能与使用请自己搜索(真的不难!)
- 文本数据可以存放在一个二维数组中:
1 | char data[LINE][LENGTH] |
- 然后你就应该知道怎么办啦!
编程时思考以下问题:
- 你眼前有三个数组,分别给他们取上你喜欢并且易于识别的名字
- 这三个数组哪两个是
stack?每个stack的top又如何设定? - 符号的优先级该如何比较?hint:写一个比较优先级的函数。
- 括号的操作应该怎么办?弹出
load_stack元素时会不会弹空? - 别忘记最后清空!
Debug
转化过程中,你将会碰到各种bug报错,以下列举一些常见报错:
segmentation fault:分割错误,一般可以诊断为死循环。如图错误:
Explanation:
index -1意思就是你的数组指针指到-1的位置,这是非常危险的,因为-1位置可能是别的数组!所以仔细查看报错行的循环/数组是否存在越界行为。一般容易发生在括号的处理中。
- 如图错误
Explanation: 可以诊断为某个数组越界。根本原因是你的输入文件名和joj的输入文件名不一样!很傻逼的报错。
- 其他报错
如果碰到其他抽象的错误,可以通过注释法查找。
注释法:把你觉得可能有问题的代码注释掉,看看还有没有相同类型的报错。
逆波兰表达式的计算
在确保正确的逆波兰表达式后,计算则相对简单不容易出错。手动计算方法如下:
找到一个操作符
找该操作符前两个操作数
将这两个操作数按照该操作符进行计算,得出结果
将这两个操作数与操作符删掉,替换成3中计算的结果
如何让计算机实现以上操作过程?
但是聪明的你应该想到,要想计算必须要让计算机认识哪个是操作符,哪个是操作数
因此我们不得不进行句法分析
句法分析(parsing)
句法分析,顾名思义就是让计算机能够识别字符串中的合法的词句。
1 | Eg1:一个string:iloveprettygirls |
所以,我们的目的就是让计算机眼里看出来的和我们人类眼里看出来的是一样的,这就是句法分析。
那如何句法分析呢?在这里给出一个hint:在push符号的时候,顺便push一个分隔符进去;push数字、小数点时就不push分隔符。
我想其他细节应该你可以解决!
Sample Code:
1 | char char_RPE[1200] = {0}; // RPE=Reverse Polish Expression; 转换后的逆波兰表达式;字符类型 |
类型转换
在计算时,你一定注意到了计算机不可能拿着字符去计算,所以我们还需要把分割好的词句变为double。
在前面的基础上,我们可以通过分隔符获得相应的字符串,然后通过这个式子double_RPE[i] = strtod([分割后的一个字符串], NULL)进行转化!
P.S. strtod的具体功能与语法请自行搜索
但是,这样转换就会带来问题,操作符进行strtod后便会变成0.00000!这无疑影响我们后续计算!
所以,我们引入辅助数组helper[ ]来判断这个字符串是数字还是操作符。
Sample Code:
1 | int helper[1200] = {0}; //辅助数组 用来判断double_RPE中的数字与符号 |
2.3.4 计算
基本准备
为了贯彻栈的“先进后出”的思想,我们不妨先把得到的double_RPE与对应的helper逆序排列。同时,我们准备好计算时的缓冲栈load_cal_stack与计算栈cal_stack.
1 | double RPE_Reverse[120] = {0.0}; //逆序RPE 便于计算 |
不难发现,我们眼前共有四个数组/栈,然后我们手里有三个“指针”(top),即表示数组中元素坐标的index.
其中top_helper_and_RPE同时控制RPE与helper,
1 |
|
最后load_stack剩下的那个数就是最后结果啦!
负数处理
虽然我们已经能够很好地转化并计算一些逆波兰表达式,然而逆波兰表达式先天性存在一个小bug——他不支持负数的运算。按照我们之前的算法,碰到负数,例如-1时,我们会把他分割为"-","1"而不是"-1".
因此在计算时碰到负数会出现缺少一个操作数的情况,从而无法获得结果。所以,我们需要对式子中的负数进行预处理。
这个问题确实令人烦躁,但是静下心来仔细思考我们会发现,所谓负数无非是这两种情况:
第一个字符为减号
括号内第一个字符是减号
那么我们只需分类讨论,逐个击破即可。在解决过程中,我们的目标是让负数的运算能够成立,也即解决“操作数少一个”的问题,因此我们考虑“补上一个操作符0”使得式子能够运算。换言之,我们可以把"-1+2"变为"0-1+2"
思路已经给出,具体地解决那么就靠你的代码了!
Sample Code
1 | char temp0_1[256] = {0}; |
3. 变量处理
恭喜你!你已经能够成功计算简单的数学算式了!然而接下来你还需要处理变量。变量可能出现在等式左边或者右边,并且具有不同的含义,因此我们需要对变量进行一些定义。
Lab4给出了用数组的方式进行定义,其本质上是三组信息:
1 | int variables[20] //1.变量编号 |
然而我们发现,这三组信息分别有着三个不同的数据类型,之后调用与处理的时候绝对会让你抓狂。To make your life easier, 我们引入另一种数据类型:
结构体 struct
结构体struct
如果你有一定编程基础,struct可以类比为其他语言中的class,或者是Matlab中的cell。结构体的优点在于可以容纳各种类型的数据,将某一个数据的各种不同类型的信息组合在一起形成一个整体的“结构”。看下面的例子:
1 | struct Student{ |
这样我们就定义好了Student的结构,我们可以非常轻松的调用struct中国的各种类型的数据。这种定义方式虽然没有问题,在中文互联网十分常见,但是每当我们要调用的时候就要struct XXX,非常麻烦不好看,因此我们普遍采用下面的方法调用:
1 | typedef struct |
所以很自然的,我们可以定义struct Variables来实现我们对变量的操作:
Sample Code
1 | typedef struct |
结构体的其他操作可以参考视频:https://youtu.be/dqa0KMSMx2w
等号左边的变量
对于一个等式,等号左边的变量应该是被赋值的变量,并且这个变量的值可以在之后被调用。我们首先需要将等式左边的变量名存储到结构体name中,最后把算好的值返回给结构体中的value。在计算时,还需要识别等式右边的变量并找出他对应的值。
对于等号左边的变量,我们可以非常容易的把他作为字符串提取出来然后写入variables.name,你可能需要用到这个函数:
1 | sprintf([写入的目标], [被写入的内容], "abc"); //"abc"告诉计算机写入的格式。 |
具体语法请自行搜索。
最后我们将计算得到的结果赋值给他就好了!
1 | variables[i].value = [FinalAnswer]; |
等号右边的变量
显然,我们需要识别右边的变量并获得其对应的数值,然后返回给用于计算的double_RPE,然而这个过程看似简单,实则困难重重,请做好debug的心理准备。
要实现识别的操作,我们需要对2.3.3中的代码进行升级
Sample Code
1 | if ((char_RPE[x] >= '0' && char_RPE[x] <= '9') || (char_RPE[x] == '.') || (char_RPE[x] >= 'a' && char_RPE[x] <= 'z')){ |
我们使用strcmp函数进行字符串的比较,用来查找右边变量对应的数值。注意,改代码直接复制不可能运行,你需要理解每一步后自己仿照这敲出来!
如果你发现结果完全不符合预期,强烈建议你使用printf来观察计算机到底在算写什么。难点在于后面四个if的条件应该怎么写。
Sample Code
1 | printf("temp:%s variable:%s\n",temp,variable[t].varname); |
终章
如果你勤于动脑,勤于动手打代码,勇于运行调试,那么到这里你应该能基本上有个比较漂亮的输出了。虽然很有可能你的结果还有错误,你的joj还告诉你runtime error,但你先别急,仔细检查你的while循环、if语句判断条件、你的top值,通过printf来观察计算机的行为并且找出错误!这一定非常煎熬,但是只要be patient,就一定可以找出对应的错误。
这里直接给出JOJ的测试点:
Sample Test
1 | //盗取JOJ测试点的方法 |
如果这些测试点能够通过,最后加上分号的功能即可!(真的很简单!)