Unix/ELF文件格式及病毒分析
★ 介紹
本文介紹了Unix病毒機(jī)制、具體實(shí)現(xiàn)以及ELF文件格式。簡(jiǎn)述了Unix病毒檢測(cè)和反檢 測(cè)技術(shù),提供了Linux/i386架構(gòu)下的一些例子。需要一些初步的Unix編程經(jīng)驗(yàn),能夠 理解Linux/i386下匯編語言,如果理解ELF本身更好。
本文沒有任何實(shí)際意義上的病毒編程技術(shù),僅僅是把病毒原理應(yīng)用到Unix環(huán)境下。這 里也不打算從頭介紹ELF規(guī)范,感興趣的讀者請(qǐng)自行閱讀ELF規(guī)范。
★ 感染 ELF 格式文件
進(jìn)程映象包含'文本段'和'數(shù)據(jù)段',文本段的內(nèi)存保護(hù)屬性是r-x,因此一般自修改 代碼不能用于文本段。數(shù)據(jù)段的內(nèi)存保護(hù)屬性是rw-。
段并不要求是頁尺寸的整數(shù)倍,這里用到了填充。
關(guān)鍵字:
[...] 一個(gè)完整的頁 M 已經(jīng)使用了的內(nèi)存 P 填充
頁號(hào) #1 [PPPPMMMMMMMMMMMM] #2 [MMMMMMMMMMMMMMMM] |-- 一個(gè)段 #3 [MMMMMMMMMMMMPPPP] /
段并沒有限制一定使用多個(gè)頁,因此單頁的段是允許的。
頁號(hào) #1 [PPPPMMMMMMMMPPPP] <-- 一個(gè)段
典型的,數(shù)據(jù)段不需要從頁邊界開始,而文本段要求起始頁邊界對(duì)齊,一個(gè)進(jìn)程映象 的內(nèi)存布局可能如下:
關(guān)鍵字:
[...] 一個(gè)完整的頁 T 文本段內(nèi)容 D 數(shù)據(jù)段內(nèi)容 P 填充
頁號(hào) #1 [TTTTTTTTTTTTTTTT] <-- 文本段內(nèi)容 #2 [TTTTTTTTTTTTTTTT] <-- 文本段內(nèi)容 #3 [TTTTTTTTTTTTPPPP] <-- 文本段內(nèi)容(部分) #4 [PPPPDDDDDDDDDDDD] <-- 數(shù)據(jù)段內(nèi)容(部分) #5 [DDDDDDDDDDDDDDDD] <-- 數(shù)據(jù)段內(nèi)容 #6 [DDDDDDDDDDDDPPPP] <-- 數(shù)據(jù)段內(nèi)容(部分)
頁1、2、3組成了文本段 頁4、5、6組成了數(shù)據(jù)段
從現(xiàn)在開始,為簡(jiǎn)便起見,段描述圖表用單頁,如下:
頁號(hào) #1 [TTTTTTTTTTTTPPPP] <-- 文本段 #2 [PPPPDDDDDDDDPPPP] <-- 數(shù)據(jù)段
在i386下,堆棧段總是在數(shù)據(jù)段被給予足夠空間之后才定位的,一般堆棧位于內(nèi)存高 端,它是向低端增長(zhǎng)的。
在ELF文件中,可裝載段都是物理映象:
ELF Header . . Segment 1 <-- 文本段 Segment 2 <-- 數(shù)據(jù)段 . .
每個(gè)段都有一個(gè)定位自身起始位置的虛擬地址。可以在代碼中使用這個(gè)地址。
為了插入寄生代碼,必須保證原來的代碼不被破壞,因此需要擴(kuò)展相應(yīng)段所需內(nèi)存。
文本段事實(shí)上不僅僅包含代碼,還有 ELF 頭,其中包含動(dòng)態(tài)鏈接信息等等。如果直 接擴(kuò)展文本段插入寄生代碼,帶來的問題很多,比如引用絕對(duì)地址等問題。可以考慮 保持文本段不變,額外增加一個(gè)段存放寄生代碼。然而引入一個(gè)額外的段的確容易引 起懷疑,很容易被發(fā)現(xiàn)。
向高端擴(kuò)展文本段或者向低端擴(kuò)展數(shù)據(jù)段都有可能引起段重疊,在內(nèi)存中重定位一個(gè) 段又會(huì)使那些引用了絕對(duì)地址的代碼產(chǎn)生問題。可以考慮向高端擴(kuò)展數(shù)據(jù)段,這不是 個(gè)好主意,有些Unix完整地實(shí)現(xiàn)了內(nèi)存保護(hù)機(jī)制,數(shù)據(jù)段是不可執(zhí)行的。
段邊界上的頁填充提供了插入寄生代碼的地方,只要空間允許。在這里插入寄生代碼 不破壞原有段內(nèi)容,不要求重定位。文本段結(jié)尾處的頁填充是個(gè)很好的地方,最后看 上去象下面這個(gè)樣子:
關(guān)鍵字:
[...] 一個(gè)完整的頁 V 寄生代碼 T 文本段內(nèi)容 D 數(shù)據(jù)段內(nèi)容 P 填充
頁號(hào) #1 [TTTTTTTTTTTTVVPP] <-- 文本段 #2 [PPPPDDDDDDDDPPPP] <-- 數(shù)據(jù)段
一個(gè)更完整的ELF可執(zhí)行布局如下:
ELF Header Program header table Segment 1 Segment 2 Section header table Section 1 . . Section n
典型的,額外的節(jié)(那些沒有相應(yīng)段的節(jié))用于存放調(diào)試信息、符號(hào)表等等。
下面是一些來自 ELF 規(guī)范的內(nèi)容:
ELF 頭位于最開始,保存一張'road map',描述了文件的組織結(jié)構(gòu)。節(jié)保存大量鏈接 信息、符號(hào)表、重定位信息等等。
如果存在一個(gè)'program header table',將告訴操作系統(tǒng)如何建立進(jìn)程映象(執(zhí)行一 個(gè)程序)。可執(zhí)行文件必須有一個(gè)'program header table',可重定位的文件不需要 該表。'section header table'描述了文件的節(jié)組織。每個(gè)節(jié)在該表中都有一個(gè)表項(xiàng), 表項(xiàng)包含了諸如節(jié)名、節(jié)尺寸等信息。鏈接過程中被用到的文件自身必須有一個(gè) 'section header table',其他目標(biāo)文件可有可無該表。
插入寄生代碼之后,ELF 文件布局如下:
ELF Header Program header table Segment 1 - 文本段(主體代碼) - 寄生代碼 Segment 2 Section header table Section 1 . . Section n
寄生代碼必須物理插入到ELF文件中,文本段必須擴(kuò)展以包含新代碼。
下面的信息來自/usr/include/elf.h
/* The ELF file header. This appears at the start of every ELF file. */
#define EI_NIDENT (16)
typedef struct { unsigned char e_ident[EI_NIDENT]; /* Magic number and other info */ Elf32_Half e_type; /* Object file type */ Elf32_Half e_Machine; /* Architecture */ Elf32_Word e_version; /* Object file version */ Elf32_Addr e_entry; /* Entry point virtual address */ Elf32_Off e_phoff; /* Program header table file offset */ Elf32_Off e_shoff; /* Section header table file offset */ Elf32_Word e_flags; /* Processor-specific flags */ Elf32_Half e_ehsize; /* ELF header size in bytes */ Elf32_Half e_phentsize; /* Program header table entry size */ Elf32_Half e_phnum; /* Program header table entry count */ Elf32_Half e_shentsize; /* Section header table entry size */ Elf32_Half e_shnum; /* Section header table entry count */ Elf32_Half e_shstrndx; /* Section header string table index */ } Elf32_Ehdr;
e_entry 保存了程序入口點(diǎn)的虛擬地址。
e_phoff 是'program header table'在文件中的偏移。因此為了讀取 'program header table',需要調(diào)用lseek()定位該表。
e_shoff 是'section header table'在文件中的偏移。該表位于文件尾部,在文本段 尾部插入寄生代碼之后,必須更新e_shoff指向新的偏移。
/* Program segment header. */
typedef struct { Elf32_Word p_type; /* Segment type */ Elf32_Off p_offset; /* Segment file offset */ Elf32_Addr p_vaddr; /* Segment virtual address */ Elf32_Addr p_paddr; /* Segment physical address */ Elf32_Word p_filesz; /* Segment size in file */ Elf32_Word p_memsz; /* Segment size in memory */ Elf32_Word p_flags; /* Segment flags */ Elf32_Word p_align; /* Segment alignment */ } Elf32_Phdr;
可裝載段(文本段/數(shù)據(jù)段)在'program header'中由成員變量p_type標(biāo)識(shí)出是可裝載 的,其值為PT_LOAD (1)。與'ELF header'中的e_shoff一樣,這里的p_offset成員 必須在插入寄生代碼后更新以指向新偏移。
p_vaddr 指定了段的起始虛擬地址。以p_vaddr為基地址,重新計(jì)算e_entry,就可以 指定程序流從何處開始。
可以利用p_vaddr指定程序流從何處開始。
p_filesz 和 p_memsz 分別對(duì)應(yīng)該段占用的文件尺寸和內(nèi)存尺寸。
.bss 節(jié)對(duì)應(yīng)數(shù)據(jù)段里未初始化的數(shù)據(jù)部分。我們不想讓未初始化的數(shù)據(jù)占用文件空 間,但是進(jìn)程映象必須保證能夠分配足夠的內(nèi)存空間。.bss 節(jié)位于數(shù)據(jù)段尾部,任 何超過文件尺寸的定位都假設(shè)位于該節(jié)中。
/* Section header. */
typedef struct { Elf32_Word sh_name; /* Section name (string tbl index) */ Elf32_Word sh_type; /* Section type */ Elf32_Word sh_flags; /* Section flags */ Elf32_Addr sh_addr; /* Section virtual addr at execution */ Elf32_Off sh_offset; /* Section file offset */ Elf32_Word sh_size; /* Section size in bytes */ Elf32_Word sh_link; /* Link to another section */ Elf32_Word sh_info; /* Additional section information */ Elf32_Word sh_addralign; /* Section alignment */ Elf32_Word sh_entsize; /* Entry size if section holds table */ } Elf32_Shdr;
sh_offset 指定了節(jié)在文件中的偏移。
為了在文本段末尾插入寄生代碼,我們必須做下列事情:
* 修正'ELF header'中的 p_shoff * 定位'text segment program header' * 修正 p_filesz * 修正 p_memsz * 對(duì)于文本段phdr之后的其他phdr * 修正 p_offset * 對(duì)于那些因插入寄生代碼影響偏移的每節(jié)的shdr * 修正 sh_offset * 在文件中物理地插入寄生代碼到這個(gè)位置 text segment p_offset + p_filesz (original)
這里存在一個(gè)大問題,ELF 規(guī)范中指出,
p_vaddr mod PAGE_SIZE == p_offset mod PAGE_SIZE
為了滿足這個(gè)要求:
* 修正'ELF header'中的 p_shoff ,增加 PAGE_SIZE 大小 * 定位'text segment program header' * 修正 p_filesz * 修正 p_memsz * 對(duì)于文本段phdr之后的其他phdr * 修正 p_offset ,增加 PAGE_SIZE 大小 * 對(duì)于那些因插入寄生代碼影響偏移的每節(jié)的shdr * 修正 sh_offset ,增加 PAGE_SIZE 大小 * 在文件中物理地插入寄生代碼以及填充(確保構(gòu)成一個(gè)完整頁)到這個(gè)位置 text segment p_offset + p_filesz (original)
我們還需要修正程序入口點(diǎn)的虛擬地址,使得寄生代碼先于宿主代碼執(zhí)行。同時(shí)需要 在寄生代碼尾部能夠跳轉(zhuǎn)回宿主代碼原入口點(diǎn)繼續(xù)正常流程。
* 修正'ELF header'中的 p_shoff ,增加 PAGE_SIZE 大小 * 修正寄生代碼的尾部,使之能夠跳轉(zhuǎn)回宿主代碼原入口點(diǎn) * 定位'text segment program header' * 修正 'ELF header'中的 e_entry ,指向 p_vaddr + p_filesz * 修正 p_filesz * 修正 p_memsz * 對(duì)于文本段phdr之后的其他phdr * 修正 p_offset ,增加 PAGE_SIZE 大小 * 對(duì)于文本段的最后一個(gè)shdr * 修正sh_len(應(yīng)該是sh_size吧,不確定),增加寄生代碼大小 * 對(duì)于那些因插入寄生代碼影響偏移的每節(jié)的shdr * 修正 sh_offset ,增加 PAGE_SIZE 大小 * 在文件中物理地插入寄生代碼以及填充(確保構(gòu)成一個(gè)完整頁)到這個(gè)位置 text segment p_offset + p_filesz (original)
病毒可以隨機(jī)遍歷一個(gè)目錄樹,尋找那些e_type等于 ET_EXEC 或者 ET_DYN 的文件, 加以感染,這分別是可執(zhí)行文件和動(dòng)態(tài)鏈接庫文件。
★ 分析Linux病毒
病毒要求不使用庫,避開libc,轉(zhuǎn)而使用系統(tǒng)調(diào)用機(jī)制。 為了動(dòng)態(tài)申請(qǐng)堆內(nèi)存用于phdr table和shdr table,應(yīng)該使用brk系統(tǒng)調(diào)用。 利用與緩沖區(qū)溢出相同的技術(shù)取得常量字符串的地址。
使用gcc -S編譯c代碼,觀察調(diào)整asm代碼。 注意在進(jìn)入/離開寄生代碼的時(shí)候保存/恢復(fù)寄存器。
利用objdump -D觀察調(diào)整一些需要確定的偏移量。
★ 檢測(cè)病毒
這里描述的病毒很容易檢測(cè)。最顯眼的是程序入口點(diǎn)不在常規(guī)節(jié)中,甚至干脆不在任 何節(jié)中。清理病毒的過程和感染病毒的過程類似。
用objdump --all-headers很容易定位程序入口點(diǎn),用objdump --disassemble-all 跟蹤下去就可以得到程序原入口點(diǎn)。
缺省程序入口點(diǎn)是_start,但是可以在鏈接的時(shí)候更改它。
★ 結(jié)論
Unix病毒盡管不流行,但的確可行。
