git对象

1、对象类型

git对象库是Git版本库实现的核心,它包含了原始数据文件和所有的日志信息、作者信息、日期,已经其他用来重建项目任意版本或者分支的信息。位于.git/objects目录下。

├── HEAD
├── branches
├── config
├── description
├── hooks
│ ├── pre-commit.sample
│ ├── pre-push.sample
│ └── ...
├── info
│ └── exclude
├── objects
│ ├── info
│ └── pack
└── refs
 ├── heads
 └── tags

git对象库中有四种类型:块(blob)、目录树(tree)、提交(commit)、标签(tag)。这四种原子对象构成了Git高层数据结构的基础。
git对象的寻址使用40位的16进制数表示,也就是SHA1或者散列码,例如7f8aacaddffe009fff75b81187527c35a51f3eac。为了管理方便在文件系统中前两位作为文件夹的名字,后38为作为文件名字。
你可能感觉用40位作为git对象的寻址ID,可能会存在不同的内容但是散列码相同的情况,你的感觉是正确的,但是这种情况出现的概率肯定可以忽略不计了。
其对象的关系如下:
git对象

git对象

2、blob 块

blob对象存储文件的时间内容,实际为工作空间的文件内容。具体为对文件内容使用zlib算法压缩,然后对得到的字节取hash算法。因此相同的文件内容,得到的blob对象肯定是相同的。
示例:

git init temp              -----初始化一个空的git仓库
cd temp
echo "Welcome to git">hello.txt
git add hello.txt             ------添加到暂存器

此时我们查看.git/objects的目录如下:
git对象

此时我们可以通过git cat-file命令查看git对象的内容。注意cat-file命令可以查看所有的git对象。这个命令可以查看所有的git对象。

git cat-file -p b08a2810d8a4542f350f650435f506c6c81ca9b2

Welcome to git

由于git对文件内容使用压缩然后对内容取hash作为文件名的特性,因此不管文件系统中同样文件内容有几份,在git对象中都仅仅存一份。

3. 目录树 tree

git目录树对象映射操作系统中工作空间的目录,不同的是工作空间的目录下是文件和文件夹的集合,而目录树对象则为blob对象和目录树对象的集合。

mkdir src
cd src
cp ../hello.txt hello.txt
git add hello.txt
git write-tree   -----git的内部命令,commit命令基本等于write-tree 和commit-tree命令

此时我们使用write-tree命令返回的hash值使用cat命令
git对象

从图中可以看出内容相同的文件,blob是相同的,命令树tree对象是对应文件系统的文件夹的一个映射。

4.commit提交

提交是我们使用git的时候经常的动作,每一个提交都执行了一个目录树对象。同时提交也有一个或者多个父提交。我们现在使用commit-tree命令来关联目录树对象吧(一般使用commit命令来自动创建树对象和关联父提交)。
我们可以使用git $command –help来查看命令的资料文档,例如git commit –help 、git pull –help

 git commit-tree 5657a3b1d1454667d51f8c64c1fe9830276cdcea -m "1 commit"         ----初次提交所以没有指定父提交
7df70363051681bdd078b6a1a3fc9fe3d1595325           ----返回commit对象的HASH值

git cat-file -p 7df70363051681bdd078b6a1a3fc9fe3d1595325
tree 5657a3b1d1454667d51f8c64c1fe9830276cdcea
author xxxxxxx <xxxx@163.com> 1516538936 +0800
committer xxxx <xxxx@163.com> 1516538936 +0800

1 commit

注意此时当我们使用git log命令并不会显示刚刚的提交,需要使用 git merge 7df70363051681bdd078b6a1a3fc9fe3d1595325命令合并到master分支。可以看出git commit命令基本等于write-tree commit-tree merge命令。

现在我们修改工作空间中的hello.txt命令,然后提交查看目录树的内容。
git对象
注意看tree对象和第一次提交队对应的tree对象相同,都是e15a40c68bd15301b60d21c204a5e7a87d62d8a1,而本身我们也没有修改其文件夹下面的任何内容。而blob对象32690ead83f3b77ad763e9e2c2e60ce3706cf117的内容是两行,说明git对象内部提交指定的tree对象是工作空间的一个快照,而不是存储的增量(否则内容就是刚刚添加的一行了)。

5.标签 tag

标签仅仅是一个提交的快照,而且不允许修改其内容。

$ git tag 1.0
$ git cat-file -p 1.0
tree f935b24b9a688ba5050fda30d70801c9092caeaa
parent 7df70363051681bdd078b6a1a3fc9fe3d1595325
author xxx <xxx@163.com> 1516542403 +0800
committer xxx <xxx@163.com> 1516542403 +0800

2 commit

6.F&Q

1.git的编码方式

git的blob对象使用字节流进行存储,因此不存在编码问题。
对于目录树对象对应的路径、commit对应的message注释,默认都使用UTF-8编码。

如果想修改编码格式请参照(除非有特别的理由):https://git-scm.com/docs/git-commit/1.8.0.1#_discussion

原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/tech/opensource/185096.html

(0)
上一篇 2021年11月4日 06:00
下一篇 2021年11月4日 06:01

相关推荐

发表回复

登录后才能评论