查看原文
其他

IO-FILE中的stdin介绍

Mr.Bean 看雪学苑 2022-07-01

本文为看雪论坛优秀文章

看雪论坛作者ID:Mr.Bean



本文为科普文,便于新手更好的了解IO-FILE中的stdin。


网上的很多教程对IO-FILE其实讲的都比较详细了,尤其是这里,从源码的角度看fread函数,讲的非常透彻。


本文换一个角度,从几个关键指针的角度来看IO-FILE中的stdin,让大家搞明白IO-FILE中的stdin大概是怎么回事。


IO-FILE中的stdin,一些常见的输入函数都会涉及,如scanf,fread函数,这些函数最关键的地方在于有一块输入缓冲区,用户输入的数据会先放到输入缓冲区中,函数再根据需要从缓冲区内读取数据(如fread的size大小,scanf中的格式化字符串等)。

直接看一段代码便于理解:


#include<unistd.h>#include<stdio.h>int main(){ char buf[10]; int number1; int number2; int number3; int number4; int number5; fread(buf,1,10,stdin); puts("buf:"); write(1,buf,10); printf("\n"); puts("----------"); scanf("%d",&number1); printf("number1:%d\n",number1); printf("----------------\n"); scanf("%d",&number2); printf("number2:%d\n",number2); printf("----------------\n"); scanf("%d",&number3); printf("number3:%d\n",number3); printf("----------------\n"); getc(stdin); scanf("%d",&number4); printf("number4:%d\n",number4); getc(stdin); scanf("%d",&number5); printf("number5:%d\n",number5);}


程序首先调用fread函数,在这个函数中,程序会调用系统函数读取终端输入。

在读取终端输入之前,系统会开辟一个输入缓冲区,_IO_buf_base指向这个输入缓冲区的起始位置,_IO_buf_end指向输入缓冲区的末尾。

此时_IO_read_ptr和_IO_read_end都为0。然后系统从终端中读入数据,我这边输入的数据是aaaaaaaaaa10a20,来看一下执行完fread之后指针的变化。

可以看出,_IO_read_ptr指向的是缓冲区内还未被读取的数据起始位置。_IO_read_end指向的是缓冲区内还未被读取的数据末尾位置。_IO_read_base指向读入数据的起始位置。


程序继续执行,执行第一个scanf函数,此时会将缓冲区内的数字10读入。_IO_read_ptr向后移动,继续指向缓冲区内还未被读取的数据起始位置。

此时程序继续执行,执行第二个scanf函数,但是由于此时缓冲区内存放的是一个字符a,因此scanf并不会将其读取(读取失败情况下,scanf函数会返回0),因此_IO_read_ptr并不会改变。

继续执行程序,执行第三个scanf函数,显然由于_IO_read_ptr仍然指向字符a,因此依然会读取失败。


继续执行程序,执行getc(stdin),该函数会从缓冲区中读一个字节,因此会将_IO_read_ptr+1,执行完该函数之后。


程序继续执行,执行第四个scanf,由于此时_IO_read_ptr又指向了一个数字,因此scanf将该数据读了出来。


此时_IO_read_ptr指向换行符,我们再次调用getc(stdin)让其加一,此时_IO_read_ptr便与_IO_read_end相等了。

也就是说,缓冲区内的数据都被我们读完了,那么我们调用第五次scanf的时候,便又要从终端读入数据了。


这里我输入666bbbbbbbb,第五次scanf结束之后的指针情况:


可以看到数据重新从输入缓冲区的起始位置开始存放,但是缓冲区内的老数据并未清零,只是被覆盖了。


来一个非调试版的:

关于任意地址写


当我们篡改了_IO_buf_base与_IO_buf_end,将其改为目标地址开始与结尾时,那么我们下一次的终端输入就会被写到目标地址处了。

 

写此文的灵感主要来源于做whctf2017的stackoverflow的时候,当我们篡改了_IO_buf_base与_IO_buf_end到malloc_hook处的时候,还需要经过数次循环(多次调用sub_4008c8)。


原因就是_IO_read_ptr还小于_IO_read_end,此时如果不调用getc(stdin)的的话_IO_read_ptr是没法等于_IO_read_end,那么程序也就不会从终端去读取输入了。


当然有细心的人会发现这里存在scanf函数,scanf函数其实也是可以从缓冲区内读取输入的,但是由于我们缓冲区内的数据都是不可见字符,因此scanf是会读取失败的,因此并不能增加_IO_read_ptr。



对stdin的介绍就到这里了,写的不对的地方,欢迎大家指正。




- End -



看雪ID:Mr.Bean

https://bbs.pediy.com/user-home-853476.htm

  *本文由看雪论坛 Mr.Bean 原创,转载请注明来自看雪社区。



推荐文章++++

* 基于inlinehook免重打包实现持久化NativeHook

* 反汇编代码还原之优化方式

* 从钓鱼邮件到窃密木马的完整分析

* 记使用Trace还原ollvm混淆的函数

* java类加载的过程概述







公众号ID:ikanxue
官方微博:看雪安全
商务合作:wsc@kanxue.com



求分享

求点赞

求在看


“阅读原文”一起来充电吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存