编译原理中的token简介
admin
2024-03-20 08:36:10
0

编译原理中的token简介

编译原理是介绍如何将高级程序设计语言转换成计算机硬件能识别的机器语言,以便计算机进行处理。

词法分析(Lexical Analyzer)是编译器的第一个步骤,它也被称为 扫描(scanning)。词法分析器(semantic analyzer)通过读入外部的字符流(源程序)对其进行扫描,并且把它们组成有意义的词素(lexeme)序列,对于每个词素,词法分析器都会产生词法单元(token) 作为输出。

编译原理领域中将高级程序语言中的最小的单元称为token,token是构成源程序的基本不可再分割的单元。高级程序设计语言在分析源程序时的第一步就是把源程序分割为一个个独立的token,这个过程就称为词法分析。

高级语言中的token

有以下几类:

分隔符(界限符)

关键字和保留字

标识符

操作符

字面值

高级语言中最常见的分隔符(界限符)有空格、换行符、分号、大括号等等,我们可以利用空格来分隔token、用换行符或者分号来分隔语句、用大括号或者是缩进(数量相等的空格或者是制表符)来分隔代码块(复合语句)。操作符也是一种特殊的分隔符。

标识符

编程语言的标识符是用来标识变量、自定义类型、函数等实体的符号名称,我们在后面想要使用这个实体的话只需要用这个实体的名字引用它就可以了。不同类型的标识符具有不同的作用,当标识符代表的是一个变量和函数的时候,它代表的其实是一个内存地址,我们使用变量进行内存访问、使用函数进行子程序的调用;而当标识符作为一个自定义数据类型的时候,它将在编译的时候为编译器提供组织内存的元数据信息。

关键字和保留字

关键字是指语言的设计者保留的具有特定语法含义的字符序列,每个关键字都有自己独特的用途和语法含义,我们只能按照高级程序设计语言的语法规定来使用它们。关键字是一门高级程序设计语言的语法的重要组成部分,同时也是我们为语言的编译器或解释器提供元数据信息的主要手段。保留字是一类比较特殊的关键字,是为了语言后续的升级所预留的,在当前的语言版本中,保留字还不具备任何特殊的语义,但是在后续的语言升级过程中,保留字可能会被提升为关键字。所以我们在为标识符命名的时候,也不能随意使用保留字。

操作符就是语言所使用的符号集合,一般来说操作符代表的是计算类的指令,我们会使用操作符来构建表达式,来完成计算任务。大多数的操作符会被编译成转换成计算类的指令。

按照功能分类,操作符可以做如下分类:

算术运算符

位运算符

赋值运算符

赋值复核运算符(+=这一类的)

比较运算符

逻辑运算符

括号(可以用来改变表达式的计算顺序,也可以用来进行函数调用)

自增自减操作

其他运算符,比如元素数组元素访问[],子元素访问.、->等等

按照操作数的数量,操作符可以做如下分类:

单目运算符

双目运算符

三目运算符

操作符的主要作用是用来构成表达式的,运算符有两个非常重要的特性,即优先级和结合性,这两个特性决定了表达式的计算。

优先级

我们在数学中进行四则运算的时候都知道一个计算式中要先算乘除后算加减,这个规则就是数学中四则运算的优先级规则,高级语言中的运算符的运算规则跟这个是类似的,具有更高优先级的运算符会优先占用操作数组成一个表达式进行计算产生一个值。

在所有语言中运算符的优先级规则都是非常相似的,一般来说操作数越少的操作数优先级越高,而且赋值运算符的优先级比较靠后。

结合性

优先级并不能完全解决表达式的计算顺序问题,在表达式中出现连续的多个优先级相同的运算符的时候,该以什么样的顺序进行计算呢?

高级语言中表达式的结合性就是用来解决连续多个相同优先级的运算符的计算顺序的。

结合性有两种,即左结合性和右结合性。具有左结合性的计算顺序是从左到右,右结合性的计算顺序是从右到左。

在高级语言中,存在三种最基本的字面值形式(不同语言所具有的字面值形式是不同的,但是大多数的语言都支持下面三种形式的字面值):

字符串:因为代码本身就是字符串,通常会使用界定符比如""来区分是字面值还是程序代码

数字:其实就是具有特定格式的字符串(只有数字字符,数字分隔符,进制前缀和类型后缀),因为其格式特殊,所以不需要界定符

逻辑值:通常也称为布尔值,true或者false,大部分程序设计语言中都把true和false作为关键字,但是在比较古老的编程语言中(例如C语言),没有专门代表逻辑值的数据类型,而是使用整数代表逻辑值,0代表false,所有的非0整数都代表true。

表达式(Expression)和语句(Statement)

表达式

表达式是由运算符和其运算对象组成,最简单的表达式是一个单独的运算对象,以此为基础可以创建复杂的表达式。

表达式有一个基本特征——每个表达式都会产生一个值。

根据表达式的复杂程度的不同,可以把表达式分为简单表达式和复合表达式:

简单表达式: “字面值”和“变量”。

复合表达式:由简单表达式和运算符所构成的更复杂的表达式。

语句

语句是代码的基本构建块,其引导了代码的结构,划分了代码的层次。源代码都是由一条一条的语句所构成的。

语句可以分为简单语句和复合语句。

复合语句就是用来把多条语句组合成一个整体的。

通常会在如下情况下把一系列的语句集合起来,形成一条复合语句:

流程控制

在分支或者是循环结构中,某一个分支或者是循环体中的逻辑往往用一条语句是无法完成的,这个时候我们就需要一个复合语句来组织逻辑。

函数体

毫无疑问,一个函数也可能包含多条语句。

语句块

每一门语言也都有自己组织复合语句的方式,比如Java、C、C++等语言中使用{}来组织复合语句,在Python中用缩进来组织复合语句。

编程语言中表达式和语句的关系

表达式有值,而语句不总有值。

程序是由语句组成的。语句可以是表达式,也可以不是。表达式可以当做值赋给变量。

表达式本身可以作为表达式语句,也能作为赋值语句的右值或if语句的条件等,所以表达式可以作为语句的组成部分,但不是必须成分(例如continue语句)。

相关内容

热门资讯

近一年涨364%,近两年468... 来源:今晚吃基 今天前海开源的两则公告引起我的注意。 前海开源沪港深乐享生活、前海开源人工智能主题混...
美伊、霍尔木兹海峡,最新消息!... 特朗普称与伊朗的谈判进展顺利,霍尔木兹海峡通航量上升,油价维持弱势震荡。另外,特朗普要求中东多国与以...
原创 刚... 4月21日下午,当宁德时代超级科技日的大屏幕亮起时,台下不少行业人士都愣了一下。宁德时代宣布,备受瞩...
俄罗斯知名巧克力品牌优化增效 【环球时报综合报道】俄罗斯最大巧克力生产商之一“联合糖果”正优化生产。“联合糖果”公司(旗下品牌包括...
三星半导体员工协商达成年均奖金... 但这份协议对三星而言仍可能是一次胜利,因为其奖金总额低于本土竞争对手SK海力士。 三星与曾威胁发起罢...
Google亲手把搜索框做成了... Google I/O 2026开完了。如果你以为这家公司又在炫酷炫技术,那你猜对了一半——另一半是,...
女子把2万多克黄金存珠宝店,金... 浙江杭州的林女士反映,她是做黄金生意的,从2024年7月开始,分48次陆续将22917.462克黄金...
000638,终止上市!9股获... 今日(5月25日),A股三大指数集体收涨,上证指数报收4152.57点,上涨0.96%;深证成指上涨...
原创 人... 人民币这波行情,最戏剧性的一幕发生在5月13日。当天即期收盘价直接砸到6.7905,正式踏进6.7区...
燕文物流、闪回科技、金龙电机、... 每经记者:李旭馗 每经编辑:袁东 |2026年5月26日 星期二| NO.1燕文物流、闪回科技、金龙...
一代互联网招聘神话,破产了 消费赛道雷声滚滚,招聘赛道也未能幸免。 近日,招聘行业再传重磅消息,曾被无数互联网人视作“跳槽圣地”...
字节反击腾讯称“都是卖猪食的,... 澎湃新闻记者 范佳来 实习生 吴亦菲 抖音副总裁李亮辟谣“反击腾讯”。 近日,有传言称腾讯、字节跳动...
国有大型银行板块5月25日涨0... 证券之星消息,5月25日国有大型银行板块较上一交易日上涨0.02%,中国银行领涨。当日上证指数报收于...
金属包装行业的主流发展趋势 绿色环保、智能化生产、高端化与个性化、行业整合及国际化拓展是当前金属包装行业的主要发展趋势。 绿色...
投资也有流量密码?带你了解自由... 风险提示:基金有风险,投资需谨慎。
美债收益率破5%:全球资产定价... 导读 4月美国通胀数据超预期反弹、美联储新主席沃什近期就任、中东地缘冲突推升油价、美国财政赤字高企与...
烁威光电同步完成两轮Pre-A... 【大河财立方消息】近日,北京烁威光电科技有限公司(以下简称“烁威光电”)同步完成两轮合计金额超亿元融...
库克将迎CEO告别演讲,此后转... 5月25日,知名科技记者马克 · 古尔曼发文称,今年苹果全球开发者大会 (WWDC) 将是库克作为苹...
北京集中约谈17家重点平台企业... 据北京市市场监督管理局5月25日消息,为加强平台经济监管,规范6·18期间平台经营行为,近日,北京市...
原创 日... 你是否听过下面这些管理名言:”永远站在顾客的立场思考问题“、”盯住客户,而不是竞争对手“、”比业绩更...