Android 虚拟机:你需要掌握的基本知识

本文简要介绍 Android Runtime 虚拟机里的一些细节点,主要包括 dex file, oat file, mirror::Class, ArtField, ArtMethod, DexCache, ClassTable 等。

了解这些细节,在后面学习类查找等原理时会轻松很多,所以先讲一下。

文章目录

dex2oat 触发场景

https://cs.android.com/android/platform/superproject/+/master:art/dex2oat/dex2oat.cc

dex2oat 的作用:对 dex 文件进行编译,根据参数,生成 oat vdex art 文件。

Android 虚拟机:你需要掌握的基本知识
Android 虚拟机:你需要掌握的基本知识

各种文件

.dex

https://cs.android.com/android/platform/superproject/+/master:art/libdexfile/dex/dex_file.h

主要看下 class_def,class_def 代表的是类的基本信息,关键内容:

  • class_idx/superclass_idx:string_id 的索引,类名字符串

  • interfaces_off:数组,对应的是实现的接口类型 id

    • type_list -> type_item -> type_idx
  • class_data_off:所有成员变量和成员函数信息

    • class_data_item
      • 定义、继承和实现的函数
        • direct_methods
          • static, private, constructor
        • virtual_methods
          • 除了 direct_methods 以外的
  • code_item 是什么?

    • code_item 存储的是 dex 中的字节码,用解释器来执行

DexFile:

DexFile(const uint8_t* base,
          size_t size,
          const uint8_t* data_begin,
          size_t data_size,
          const std::string& location,
          uint32_t location_checksum,
          const OatDexFile* oat_dex_file,
          std::unique_ptr<DexFileContainer> container,
          bool is_compact_dex);
  const Header* const header_;
  const dex::StringId* const string_ids_;
  const dex::TypeId* const type_ids_;
  const dex::FieldId* const field_ids_;
  const dex::MethodId* const method_ids_;
  const dex::ProtoId* const proto_ids_;
  const dex::ClassDef* const class_defs_;

  // If this dex file was loaded from an oat file, oat_dex_file_ contains a
  // pointer to the OatDexFile it was loaded from. Otherwise oat_dex_file_ is
  // null.
  mutable const OatDexFile* oat_dex_file_;
};

如果该 dex 是从一个 oat 文件里获取的,DexFile 中还包括一个 oat_dex_file 的指针,指向对于的 oat file。后面 loadClass 时会用到这个指针。

Dex 文件里保存的是符号引用,需要经过一次解析才能拿到最终信息,比如获取类的名称,需要通过 string_id 去 string_data 里找一下才知道。

DexCache 的存在就是为了避免重复解析。

.odex

DVM 上使用。

Android 虚拟机:你需要掌握的基本知识

.odex 在 dex 文件前增加了 header 信息,后面增加了其他 dex 的依赖和一些辅助信息。

.oat

https://cs.android.com/android/platform/superproject/+/master:art/runtime/oat_file.h

ART 上使用。

Oat 文件是一种特殊的 ELF 文件格式,它包含 dex 文件编译得到的机器指令,在 8.0 以下包括原始的 dex 内容,8.0 之后 raw dex 在 quicken 化之后是在 .vdex 里。

Android 虚拟机:你需要掌握的基本知识

  • oat data section 对应的是 dex 文件相关信息(8.0 之后在 .vdex 文件中)
  • oat exec section 对应的是 dex 编译生成的机器指令

.vdex

https://cs.android.com/android/platform/superproject/+/master:art/runtime/vdex_file.h
Android 虚拟机:你需要掌握的基本知识

  • VerifierDeps 用于快速校验 dex 里 method 合法性

8.0 增加,目的是减少 dex2oat 时间(https://android-review.googlesource.com/c/platform/art/+/264514)。

Android 虚拟机:你需要掌握的基本知识

从 vdex 里提取 dex:https://github.com/anestisb/vdexExtractor

dex2oat::Setup():

        // No need to verify the dex file when we have a vdex file, which means it was already
        // verified.
        const bool verify =
            (input_vdex_file_ == nullptr) && !compiler_options_->AssumeDexFilesAreVerified();
        if (!oat_writers_[i]->WriteAndOpenDexFiles(
            vdex_files_[i].get(),
            verify,
            update_input_vdex_,
            copy_dex_files_,
            &opened_dex_files_map,
            &opened_dex_files)) {
          return dex2oat::ReturnCode::kOther;
        }

如果之前做过 dex2oat,有 vdex 文件,下次执行 dex2oat 时(比如系统 OTA)就可以省去重新 verify dex 的过程。

类信息

mirror::Class

https://cs.android.com/android/platform/superproject/+/master:art/runtime/mirror/class.h

// C++ mirror of java.lang.Class
class MANAGED Class final : public Object {
  // Defining class loader, or null for the "bootstrap" system loader.
  HeapReference<ClassLoader> class_loader_;

  // 数组元素的类型
  // (for String[][][], this will be String[][]). null for non-array classes.
  HeapReference<Class> component_type_;

  // 这个类对应的 DexCache 对象,虚拟机直接创建的类没有这个值(数组、基本类型)
  HeapReference<DexCache> dex_cache_;

  //接口表,包括自己实现的和继承的
  HeapReference<IfTable> iftable_;

  // 类名,"java.lang.Class" or "[C"
  HeapReference<String> name_;

  HeapReference<Class> super_class_;

  //虚函数表,invoke-virtual 调用的函数,包括父类的和当前类的
  HeapReference<PointerArray> vtable_;

  //本类定义的非静态成员,不包括父类的。
  uint64_t ifields_;

  /* [0,virtual_methods_offset_):本类的direct函数
     [virtual_methods_offset_,copied_methods_offset_):本类的virtual函数
     [copied_methods_offset_, ...) 诸如miranda函数等  */
  uint64_t methods_;

  // Static fields length-prefixed array.
  uint64_t sfields_;

  uint32_t access_flags_;
  uint32_t class_flags_;

  // Total size of the Class instance; used when allocating storage on gc heap
  uint32_t class_size_;

  // Tid used to check for recursive <clinit> invocation.
  pid_t clinit_thread_id_;
  static_assert(sizeof(pid_t) == sizeof(int32_t), "java.lang.Class.clinitThreadId size check");

  // ClassDef index in dex file, -1 if no class definition such as an array.
  int32_t dex_class_def_idx_;

  // Type index in dex file.
  int32_t dex_type_idx_;
};

Class 成员变量比较多,重点关注这几个:

  • iftable_:
    • 保存该类直接实现或间接实现(继承)的接口信息
    • 接口信息包含两个部分
      • 接口类所对应的 Class 对象
      • 该接口类中的方法。
  • vtable_:
    • 保存该类直接定义或间接定义的 virtual 方法
    • 比如Object类中的wait、notify、toString 等方法
  • methods_:
    • 只包含本类直接定义的 direct、virtual 方法和 Miranda 方法
    • 一般 vtable_ 包含内容会多于 methods_
  • sfields_ 静态变量
  • ifields_ 实例变量
    • ClassLinker::LoadClass 阶段分配内存和设置数据

ArtField

https://cs.android.com/android/platform/superproject/+/master:art/runtime/art_field.h

class ArtField {
  GcRoot<mirror::Class> declaring_class_;
  uint32_t access_flags_ = 0;

  // 在 dex 中 field_ids 数组中的索引
  uint32_t field_dex_idx_ = 0;
 //成员变量的offset  
  uint32_t offset_ = 0;
}

一个 ArtField 对象代表类中的一个成员变量。

offset_ 含义:

  • 如果是静态成员变量,offset_ 代表变量的存储空间在 Class 对象的内存布局里的起始位置
  • 如果是非静态成员变量,offset_ 代表在 Object 对象的内存布局里的起始位置

ArtMethod

https://cs.android.com/android/platform/superproject/+/master:art/runtime/art_method.h

Android 虚拟机:你需要掌握的基本知识

ArtMethod 代表一个运行在 Android Runtime 中的 Java 侧的方法,主要结构:

class ArtMethod {

 protected:
  GcRoot<mirror::Class> declaring_class_;

  std::atomic<std::uint32_t> access_flags_;

  //在 dex file 中的位置
  // Offset to the CodeItem. 
  uint32_t dex_code_item_offset_;
  //在 dex 中 method_id 的 index,通过它获取名称等信息
  uint32_t dex_method_index_;

  /* End of dex file fields. */

  // static/direct method -> declaringClass.directMethods
  // virtual method -> vtable
  // interface method -> ifTable
  uint16_t method_index_;

  // 调用一次加一,超过阈值可能会被编译成本地方法
  uint16_t hotness_count_;

  // Fake padding field gets inserted here.

  // Must be the last fields in the method.
  struct PtrSizedFields {
    //方法入口地址
    void* entry_point_from_quick_compiled_code_;
  } ptr_sized_fields_;
}

这个 entry_point 是在 ClassLinker#LinkCode 时设置的入口,后面执行这个方法时,不论是解释执行还是以本地机器指令执行,都通过 ArtMethod 的 GetEntryPointFromCompiledCode 获取入口点。

缓存

ClassTable

Android 虚拟机:你需要掌握的基本知识
每个 ClassLoader 有一个 class_table_,它的成员主要是一个 ClassSet vector:

 ClassTable:
  // Lock to guard inserting and removing.
  mutable ReaderWriterMutex lock_;
  // We have a vector to help prevent dirty pages after the zygote forks by calling FreezeSnapshot.
  std::vector<ClassSet> classes_ GUARDED_BY(lock_);

  // Hash set that hashes class descriptor, and compares descriptors and class loaders. Results
  // should be compared for a matching class descriptor and class loader.
  typedef HashSet<TableSlot,
                  TableSlotEmptyFn,
                  ClassDescriptorHashEquals,
                  ClassDescriptorHashEquals,
                  TrackingAllocator<TableSlot, kAllocatorTagClassTable>> ClassSet;

通过 ClassLinker::InsertClass 插入到 ClassTable 中

  • ClassLinker::InsertClassTableForClassLoader
    • ClassLinker::RegisterClassLoader 创建 ClassTable
void ClassLinker::RegisterClassLoader(ObjPtr<mirror::ClassLoader> class_loader) {
  CHECK(class_loader->GetAllocator() == nullptr);
  CHECK(class_loader->GetClassTable() == nullptr);
  Thread* const self = Thread::Current();
  ClassLoaderData data;
  data.weak_root = self->GetJniEnv()->GetVm()->AddWeakGlobalRef(self, class_loader);
  // Create and set the class table.
  data.class_table = new ClassTable;
  class_loader->SetClassTable(data.class_table);
  // Create and set the linear allocator.
  data.allocator = Runtime::Current()->CreateLinearAlloc();
  class_loader->SetAllocator(data.allocator);
  // Add to the list so that we know to free the data later.
  class_loaders_.push_back(data);
}

调用处:
Android 虚拟机:你需要掌握的基本知识
FindClass 时会调用 LookupClass 查询:


ObjPtr<mirror::Class> ClassLinker::LookupClass(Thread* self,
                                               const char* descriptor,
                                               size_t hash,
                                               ObjPtr<mirror::ClassLoader> class_loader) {
  ReaderMutexLock mu(self, *Locks::classlinker_classes_lock_);
  ClassTable* const class_table = ClassTableForClassLoader(class_loader);
  if (class_table != nullptr) {
    ObjPtr<mirror::Class> result = class_table->Lookup(descriptor, hash);
    if (result != nullptr) {
      return result;
    }
  }
  return nullptr;
}

DexCache

https://cs.android.com/android/platform/superproject/+/master:art/runtime/mirror/dex_cache.h

DexCache 保存的是一个 Dex 里解析后的成员变量、方法、类型、字符串信息。

// C++ mirror of java.lang.DexCache.
class MANAGED DexCache final : public Object {
  HeapReference<ClassLoader> class_loader_;
  // 对应的 dex 文件路径
  HeapReference<String> location_;

  uint64_t dex_file_;                // const DexFile*
  uint64_t preresolved_strings_;     // GcRoot<mirror::String*> array
                                    
  uint64_t resolved_call_sites_;     // GcRoot<CallSite>* array
  
  //field_idx                               
  uint64_t resolved_fields_;         // std::atomic<FieldDexCachePair>*
  uint64_t resolved_method_types_;   // std::atomic<MethodTypeDexCachePair>*
  uint64_t resolved_methods_;        // ArtMethod*,
  uint64_t resolved_types_;          // TypeDexCacheType*
  uint64_t strings_;                 // std::atomic<StringDexCachePair>*

  uint32_t num_preresolved_strings_;   
  uint32_t num_resolved_call_sites_;   
  uint32_t num_resolved_fields_;       
  uint32_t num_resolved_method_types_;  
  uint32_t num_resolved_methods_;      
  uint32_t num_resolved_types_;      
  uint32_t num_strings_;               

}

什么时候创建和读取呢?

  • 在 ART 中每当一个类被加载时,ART 运行时都会检查该类所属的 DEX 文件是否已经关联有一个 Dex Cache。如果还没有关联,那么就会创建一个 Dex Cache,并且建立好关联关系。

DefineClass:

  ObjPtr<mirror::DexCache> dex_cache = RegisterDexFile(*new_dex_file, class_loader.Get());
  if (dex_cache == nullptr) {
    self->AssertPendingException();
    return sdc.Finish(nullptr);
  }
  klass->SetDexCache(dex_cache);
上一篇:web scraper 里的 Element click 模拟点击「加载更多」


下一篇:免费开源的diff软件“meld”-替代beyond compare的神器