版本控制-Git对象

Git对象
  • 版本控制在于文件的控制,git的控制方法在于为每个文件生成(key,object)的结构。git利用sha-1加密算法,对每一个文件生成一个唯一的字符序列(明文大小不超过2^64位,对于普通文件,这个大小都可以满足)作为hash_key。
  • init初始化一个本地仓库,打开隐藏目录.git,其内容如下图。可以看到一个objects的目录,里面只有info和pack两个空文件夹。初始化的时候不存在任何object,也就是没有任何文件被记录下来。 版本控制-Git对象
  • 在Git系统中有四种类型的对象,几乎所有Git操作都是在这四种Git对象上进行的,所以了解这四种对象的作用对于应用Git有很大帮助。这四种对象是:
  • “blob”:一个“blob”通常用来存储文件的内容。一个“blob”对象就是一块二进制数据,它没有指向任何东西或有任何其它属性,甚至没有文件名。因为“blob”对象内容全部都是数据,所以如若两个文件在一个目录树或是一个版本仓库中有同样的数据内容,那么它们将会共享同一个“blob”对象。“blob”对象和其所对应的文件所在路径、文件名是否改被更改都完全没有关系。
  • 我们在工作目录下添加一个文件readme,里面只要一个字符串"file1 content",使用git hash-object [文件名],可以查看其经过算法生成的hash-key.这个一个40个字符长度的序列。
  • 查看object
  • 版本控制-Git对象
  • 执行:git add readme 将文件加入到暂存区之后再次查看版本控制-Git对象
  • 查看3d目录下的内容,可以看到40位的hash-key 前两位作为目录名,后38位作为文件名,标识了这个object对象,这个对象里面的内容就是刚才readme里的内容,可以查看这个对象的内容和对象类型:
  • 版本控制-Git对象
  • “tree”:像一个目录,管理一些“tree”对象或是“blob”对象。它有一串指向“blob”对象或是其它“tree”对象的指针,一般用来表示内容之间的目录层次关系(就像文件和子目录)。它的树节点信息包含文件名,hash-key,文件类型、权限等等。这样就可以组织整个需要控制文件的结构
  • 工作目录下添加一个目录dir_1,在dir_1添加一个文件1.txt 内容随意
  • 使用git add . 将文件加入暂存区,查看该文件的hash-key git hash-object版本控制-Git对象
  • 查看object文件夹内容
  • 版本控制-Git对象
  • 只存在一个6d的目录,也就是b138a对应的1.txt文件,这时我们的目录并没有生成tree对象,tree对象是在commit的过程中生成的,其生成会根据.git目录下的index文件的内容来创建。git add的操作就是将文件的信息保存到index文件中,在commit时,根据index的内容来生成tree对象。
  • 使用git ls-files --stage命令,我们看看index里的类容:

    版本控制-Git对象
  • 我们进行第一次commit,生成commit对象,同时生成tree对象,master^{tree},表示master分支所指向的tree对象。
  • 版本控制-Git对象
  • 目前我们的git仓库的内部结构如下:
  • 版本控制-Git对象
  • “commit”:“commit”对象指向一个“tree对象”,并且带有相关的描述信息,标记项目某一个特定时间点的状态。它包括一些关于时间点的元数据,如时间戳、最近一次提交的作者、指向上次提交的指针等等。
  • 刚才的总体tree图,只包含了四个对象,我们使用git log查看commit的历史
  • 版本控制-Git对象
  • 其中的fd对应的文件夹就是我们的commit对象,它指向工作目录tree,和上一次的commit,这是第一个commit ,所以上一个commit不存在。
  • 版本控制-Git对象
  • 现在我们在工作加入一个新的目录dir_2,和该目录下文件2.txt
  • 查看对象信息
  • 版本控制-Git对象
  • 这个tree包含了当前的文件目录和内容,现在我们的对象完整的图如下:
  • 版本控制-Git对象

    ps:可以看到commit对象指向了工作目录tree,这样只要切换commit,就可以随意切换我们的版本类容

PS:在Git中blob、commit和tree对象的关系看起来会如下图:

  • 版本控制-Git对象

命令总结

  • 版本控制-Git对象
上一篇:完整学习git四git对象


下一篇:Web自动化测试工具调研