PHP处理字符中的emoji表情

业务场景,开发的小程序和APP需要类似朋友圈一样的功能,然后好多客户都需要发带emoji表情的文字

所以,这里说一下php如何处理字符中的emoji表情

utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。

三个 PHP 内置函数:

mb_strlen

mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )
 
// 返回具有 encoding 编码的字符串 str 包含的字符数。多字节的字符被计为 1。
// 如果给定的 encoding 无效则返回 FALSE

mb_substr

string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )
 
// 根据字符数执行一个多字节安全的 substr() 操作。位置是从 str 的开始位置进行计数。第一个字符的位置是 0。第二个字符的位置是 1。
// mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。

strlen

int strlen ( string $string )
// 返回给定的字符串 string 的长度。

判断字符串中是否含有 emoji 表情

函数如下:

function haveEmojiChar($str)
{
    $mbLen = mb_strlen($str);
    
    $strArr = [];
    for ($i = 0; $i < $mbLen; $i++) {
        $strArr[] = mb_substr($str, $i, 1, 'utf-8');
        if (strlen($strArr[$i]) >= 4) {
            return true;
        }
    }
    
    return false;
}

移除字符串中的 emoji 表情

函数如下:

function removeEmojiChar($str)
{
    $mbLen = mb_strlen($str);
    
    $strArr = [];
    for ($i = 0; $i < $mbLen; $i++) {
        $mbSubstr = mb_substr($str, $i, 1, 'utf-8');
        if (strlen($mbSubstr) >= 4) {
            continue;
        }
        $strArr[] = $mbSubstr;
    }
    
    return implode('', $strArr);
}

MySQL 如何储存含有 emoji 表情的字符串

MySQL 中使用 utf8mb4 字符集。

PHP 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。

直接移除字符串中的 emoji 表情(该方法简单粗暴)

来源:https://mp.weixin.qq.com/s?__biz=MzU1NTEzMDAxNQ==&mid=2247485120&idx=1&sn=aa8ff5895ef418b9e6ed1a43d8f49d97&chksm=fbd84b30ccafc2268127049cf9ad889150c47d0cb8054d8821c6ce8d91366c612c20bcb8dd4f&mpshare=1&scene=23&srcid=&sharer_sharetime=1588224122040&sharer_shareid=3dfb54f6b438c03008a5b04527be9c8f#rd

上一篇:支持中文的PHP按字符串长度分割成数组代码


下一篇:各变量所占字节问题,strlen(),sizeof()相关问题