`strtod(“3ex”,&end)应该是什么结果? `sscanf`呢?

在我的实验中这个表达
double d = strtod("3ex",&end);

用3.0初始化d,并在输入字符串中将结束指针放在’e’字符.这正是我期望它的行为. ‘e’字符可能看起来是指数部分的开始,但是由于缺少实际指数值(6.4.4.2要求),所以’e’应被视为一个完全独立的字符.

但是,当我做

double d;
char c;
sscanf("3ex","%lf%c",&d,&c);

我注意到,sscanf对%lf格式说明符消耗“3”和“e”.变量d接收3.0值.变量c最后以“x”表示.这看起来很奇怪,有两个原因.

首先,由于语言规范在描述%f格式说明符的行为时指的是strtod,所以我直觉地期望%lf以与strtod相同的方式处理输入(即选择与终止点相同的位置).但是,我知道scanf应该在历史上返回不超过一个字符回到输入流.这限制了任何预先scanf可以由一个字符执行的距离.上面的例子至少需要两个字符.所以,假设我接受的是,%lf从输入流中消耗’3’和’e’.

但是我们遇到第二个问题.现在sscanf必须将“3e”转换成double类型. “3e”不是浮点常量的有效表示(根据6.4.4.2,指数值不是可选的).我希望sscanf将此输入视为错误:在%lf转换期间终止,返回0并保持d和c不变.但是,上述sscanf成功完成(返回2).

这种行为在标准库的GCC和MSVC实现之间是一致的.

所以,我的问题是,在C语言标准文档中,恰好在sscanf中,如上所述,参考以上两点:消耗多于strtod,并成功地将这样的序列转换为“3e”?

通过查看我的实验结果,我可能可以“反向工程”sscanf的行为:消耗尽可能多的“看起来”不会退步,然后将消耗的序列传递给strtod.这样,’e’被%lf消耗,然后被strtod忽略.但是正是语言规范中的一切吗?

解决方法

我刚才在 die.net发现下面的描述

The strtod(),strtof(),and strtold() functions convert the initial
portion of the string pointed to by nptr to double,float,and long
double representation,respectively.

The expected form of the (initial portion of the) string is optional
leading white space as recognized by isspace(3),an optional plus
(‘+’) or minus sign (‘-‘) and then either (i) a decimal number,or
(ii) a hexadecimal number,or (iii) an infinity,or (iv) a NAN
(not-a-number).

A decimal number consists of a nonempty sequence of decimal digits
possibly containing a radix character (decimal point,
locale-dependent,usually ‘.’),optionally followed by a decimal
exponent. A decimal exponent consists of an ‘E’ or ‘e’,followed by an
optional plus or minus sign,followed by a nonempty sequence of
decimal digits,and indicates multiplication by a power of 10.

A hexadecimal number consists of a “0x” or “0X” followed by a nonempty
sequence of hexadecimal digits possibly containing a radix character,
optionally followed by a binary exponent. A binary exponent consists
of a ‘P’ or ‘p’,followed by an optional plus or minus sign,followed
by a nonempty sequence of decimal digits,and indicates multiplication
by a power of 2. At least one of radix character and binary exponent
must be present.

An infinity is either “INF” or “INFINITY”,disregarding case.

A NAN is “NAN” (disregarding case) optionally followed by ‘(‘,a
sequence of characters,followed by ‘)’. The character string
specifies in an implementation-dependent way the type of NAN.

然后我进行了一个实验,我用gcc执行下面的代码

#include <stdlib.h>
#include <stdio.h>

char head[1024],*tail;

void core(const char *stmt){
    sprintf(head,"%s",stmt);
    double d=strtod(head,&tail);
    printf("cover %s to %.2f with length=%ld.\n",head,d,tail-head);
}

int main(){
    core("3.0x");
    core("3e");
    core("3ex");
    core("3e0x");

    return 0;
}

并得到结果

cover 3.0x to 3.00 with length=3.
cover 3e to 3.00 with length=1.
cover 3ex to 3.00 with length=1.
cover 3e0x to 3.00 with length=3.

所以,似乎应该有’e’后面的数字.

对于sscanf,我用gcc代码进行了另一个实验:

#include <stdlib.h>
#include <stdio.h>

char head[1024];

void core(const char *stmt){
    int i;sscanf(stmt,"%x%s",&i,head);
    printf("sscanf %s catch %d with '%s'.\n",stmt,i,head);
}

int main(){
    core("0");
    core("0x0g");
    core("0x1g");
    core("0xg");

    return 0;
}

然后得到以下输出:

sscanf 0 catch 0 with ''.
sscanf 0x0g catch 0 with 'g'.
sscanf 0x1g catch 1 with 'g'.
sscanf 0xg catch 0 with 'g'.

似乎sscanf会尝试更多的字符,如果它被判定为法律目前(可能与不完整的情况非法),则不会被翻转.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


一.C语言中的static关键字 在C语言中,static可以用来修饰局部变量,全局变量以及函数。在不同的情况下static的作用不尽相同。 (1)修饰局部变量 一般情况下,对于局部变量是存放在栈区的,并且局部变量的生命周期在该语句块执行结束时便结束了。但是如果用static进行修饰的话,该变量便存
浅谈C/C++中的指针和数组(二) 前面已经讨论了指针和数组的一些区别,然而在某些情况下,指针和数组是等同的,下面讨论一下什么时候指针和数组是相同的。C语言标准对此作了说明:规则1:表达式中的数组名被编译器当做一个指向该数组第一个元素的指针; 注:下面几种情况例外 1)数组名作为sizeof的操作数
浅谈C/C++中的指针和数组(一)指针是C/C++的精华,而指针和数组又是一对欢喜冤家,很多时候我们并不能很好的区分指针和数组,对于刚毕业的计算机系的本科生很少有人能够熟练掌握指针以及数组的用法和区别。造成这种原因可能跟现在大学教学以及现在市面上流行的很多C或者C++教程有关,这些教程虽然通俗易懂,
从两个例子分析C语言的声明 在读《C专家编程》一书的第三章时,书中谈到C语言的声明问题,《C专家编程》这本书只有两百多页,却花了一章的内容去阐述这个问题,足以看出这个问题的重要性,要想透彻理解C语言的声明问题仅仅看书是远远不够的,需要平时多实践并大量阅读别人写的代码。下面借鉴《C专家编程》书中的两个
C语言文件操作解析(一)在讨论C语言文件操作之前,先了解一下与文件相关的东西。一.文本文件和二进制文件 文本文件的定义:由若干行字符构成的计算机文件,存在于计算机系统中。文本文件只能存储文件中的有效字符信息,不能存储图像、声音等信息。狭义上的二进制文件则指除开文本文件之外的文件,如图片、DOC文档。
C语言文件操作解析(三) 在前面已经讨论了文件打开操作,下面说一下文件的读写操作。文件的读写操作主要有4种,字符读写、字符串读写、块读写以及格式化读写。一.字符读写 字符读写主要使用两个函数fputc和fgetc,两个函数的原型是: int fputc(int ch,FILE *fp);若写入成功则
浅谈C语言中的位段 位段(bit-field)是以位为单位来定义结构体(或联合体)中的成员变量所占的空间。含有位段的结构体(联合体)称为位段结构。采用位段结构既能够节省空间,又方便于操作。 位段的定义格式为: type [var]:digits 其中type只能为int,unsigned int,s
C语言文件操作解析(五)之EOF解析 在C语言中,有个符号大家都应该很熟悉,那就是EOF(End of File),即文件结束符。但是很多时候对这个理解并不是很清楚,导致在写代码的时候经常出错,特别是在判断文件是否到达文件末尾时,常常出错。1.EOF是什么? 在VC中查看EOF的定义可知: #def
关于VC+ʶ.0中getline函数的一个bug 最近在调试程序时,发现getline函数在VC+ʶ.0和其他编译器上运行结果不一样,比如有如下这段程序:#include &lt;iostream&gt;#include &lt;string&gt;using namespace std;int
C/C++浮点数在内存中的存储方式 任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU
浅析C/C++中的switch/case陷阱 先看下面一段代码: 文件main.cpp#includeusing namespace std;int main(int argc, char *argv[]){ int a =0; switch(a) { case ...
浅谈C/C++中的typedef和#define 在C/C++中,我们平时写程序可能经常会用到typedef关键字和#define宏定义命令,在某些情况下使用它们会达到相同的效果,但是它们是有实质性的区别,一个是C/C++的关键字,一个是C/C++的宏定义命令,typedef用来为一个已有的数据类型
看下面一道面试题:#include&lt;stdio.h&gt;#include&lt;stdlib.h&gt;int main(void) { int a[5]={1,2,3,4,5}; int *ptr=(int *)(&amp;aʱ); printf(&quot;%d,%d&quot;,*(
联合体union 当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union)。在C Programming Language 一书中对于联合体是这么描述的: 1)联合体是一个结构; 2)它的所有成员相对于基地址的偏移量都为0; 3)此结构空间要大到足够容纳最&quot;宽&quo
从一个程序的Bug解析C语言的类型转换 先看下面一段程序,这段程序摘自《C 专家编程》:#include&lt;stdio.h&gt;int array[]={23,34,12,17,204,99,16};#define TOTAL_ELEMENTS (sizeof(array)/sizeof(ar
大端和小端 嵌入式开发者应该对大端和小端很熟悉。在内存单元中数据是以字节为存储单位的,对于多字节数据,在小端模式中,低字节数据存放在低地址单元,而在大端模式中,低字节数据存放在高地址单元。比如一个定义一个short型的变量a,赋值为1,由于short型数据占2字节。在小端模式中,其存放方式为0X40
位运算和sizeof运算符 C语言中提供了一些运算符可以直接操作整数的位,称为位运算,因此位运算中的操作数都必须是整型的。位运算的效率是比较高的,而且位运算运用好的话会达到意想不到的效果。位运算主要有6种:与(&amp;),或(|),取反(~),异或(^),左移(&gt;)。1.位运算中的类型转换位
C语言文件操作解析(四)在文件操作中除了打开操作以及读写操作,还有几种比较常见的操作。下面介绍一下这些操作中涉及到的函数。一.移动位置指针的函数 rewind函数和fseek函数,这两个函数的原型是:void rewind(FILE *fp); 将位置指针移动到文件首 int fseek(FILE
结构体字节对齐 在用sizeof运算符求算某结构体所占空间时,并不是简单地将结构体中所有元素各自占的空间相加,这里涉及到内存字节对齐的问题。从理论上讲,对于任何变量的访问都可以从任何地址开始访问,但是事实上不是如此,实际上访问特定类型的变量只能在特定的地址访问,这就需要各个变量在空间上按一定的规则排
C语言文件操作解析(二)C语言中对文件进行操作必须首先打开文件,打开文件主要涉及到fopen函数。fopen函数的原型为 FILE* fopen(const char *path,const char *mode) 其中path为文件路径,mode为打开方式 1)对于文件路径,只需注意若未明确给出绝