LCOV - code coverage report
Current view: top level - lib/lzo - lzo1x_compress.c (source / functions) Hit Total Coverage
Test: combined.info Lines: 0 192 0.0 %
Date: 2022-04-01 13:59:58 Functions: 0 4 0.0 %
Branches: 0 94 0.0 %

           Branch data     Line data    Source code
       1                 :            : // SPDX-License-Identifier: GPL-2.0-only
       2                 :            : /*
       3                 :            :  *  LZO1X Compressor from LZO
       4                 :            :  *
       5                 :            :  *  Copyright (C) 1996-2012 Markus F.X.J. Oberhumer <markus@oberhumer.com>
       6                 :            :  *
       7                 :            :  *  The full LZO package can be found at:
       8                 :            :  *  http://www.oberhumer.com/opensource/lzo/
       9                 :            :  *
      10                 :            :  *  Changed for Linux kernel use by:
      11                 :            :  *  Nitin Gupta <nitingupta910@gmail.com>
      12                 :            :  *  Richard Purdie <rpurdie@openedhand.com>
      13                 :            :  */
      14                 :            : 
      15                 :            : #include <linux/module.h>
      16                 :            : #include <linux/kernel.h>
      17                 :            : #include <asm/unaligned.h>
      18                 :            : #include <linux/lzo.h>
      19                 :            : #include "lzodefs.h"
      20                 :            : 
      21                 :            : static noinline size_t
      22                 :          0 : lzo1x_1_do_compress(const unsigned char *in, size_t in_len,
      23                 :            :                     unsigned char *out, size_t *out_len,
      24                 :            :                     size_t ti, void *wrkmem, signed char *state_offset,
      25                 :            :                     const unsigned char bitstream_version)
      26                 :            : {
      27                 :          0 :         const unsigned char *ip;
      28                 :          0 :         unsigned char *op;
      29                 :          0 :         const unsigned char * const in_end = in + in_len;
      30                 :          0 :         const unsigned char * const ip_end = in + in_len - 20;
      31                 :          0 :         const unsigned char *ii;
      32                 :          0 :         lzo_dict_t * const dict = (lzo_dict_t *) wrkmem;
      33                 :            : 
      34                 :          0 :         op = out;
      35                 :          0 :         ip = in;
      36                 :          0 :         ii = ip;
      37         [ #  # ]:          0 :         ip += ti < 4 ? 4 - ti : 0;
      38                 :            : 
      39                 :          0 :         for (;;) {
      40                 :          0 :                 const unsigned char *m_pos = NULL;
      41                 :          0 :                 size_t t, m_len, m_off;
      42                 :          0 :                 u32 dv;
      43                 :          0 :                 u32 run_length = 0;
      44                 :          0 : literal:
      45                 :          0 :                 ip += 1 + ((ip - ii) >> 5);
      46                 :          0 : next:
      47         [ #  # ]:          0 :                 if (unlikely(ip >= ip_end))
      48                 :            :                         break;
      49         [ #  # ]:          0 :                 dv = get_unaligned_le32(ip);
      50                 :            : 
      51         [ #  # ]:          0 :                 if (dv == 0 && bitstream_version) {
      52                 :          0 :                         const unsigned char *ir = ip + 4;
      53                 :          0 :                         const unsigned char *limit = ip_end
      54                 :          0 :                                 < (ip + MAX_ZERO_RUN_LENGTH + 1)
      55                 :            :                                 ? ip_end : ip + MAX_ZERO_RUN_LENGTH + 1;
      56                 :            : #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && \
      57                 :            :         defined(LZO_FAST_64BIT_MEMORY_ACCESS)
      58                 :          0 :                         u64 dv64;
      59                 :            : 
      60         [ #  # ]:          0 :                         for (; (ir + 32) <= limit; ir += 32) {
      61         [ #  # ]:          0 :                                 dv64 = get_unaligned((u64 *)ir);
      62                 :          0 :                                 dv64 |= get_unaligned((u64 *)ir + 1);
      63                 :          0 :                                 dv64 |= get_unaligned((u64 *)ir + 2);
      64                 :          0 :                                 dv64 |= get_unaligned((u64 *)ir + 3);
      65         [ #  # ]:          0 :                                 if (dv64)
      66                 :            :                                         break;
      67                 :            :                         }
      68         [ #  # ]:          0 :                         for (; (ir + 8) <= limit; ir += 8) {
      69         [ #  # ]:          0 :                                 dv64 = get_unaligned((u64 *)ir);
      70         [ #  # ]:          0 :                                 if (dv64) {
      71                 :            : #  if defined(__LITTLE_ENDIAN)
      72                 :          0 :                                         ir += __builtin_ctzll(dv64) >> 3;
      73                 :            : #  elif defined(__BIG_ENDIAN)
      74                 :            :                                         ir += __builtin_clzll(dv64) >> 3;
      75                 :            : #  else
      76                 :            : #    error "missing endian definition"
      77                 :            : #  endif
      78                 :          0 :                                         break;
      79                 :            :                                 }
      80                 :            :                         }
      81                 :            : #else
      82                 :            :                         while ((ir < (const unsigned char *)
      83                 :            :                                         ALIGN((uintptr_t)ir, 4)) &&
      84                 :            :                                         (ir < limit) && (*ir == 0))
      85                 :            :                                 ir++;
      86                 :            :                         if (IS_ALIGNED((uintptr_t)ir, 4)) {
      87                 :            :                                 for (; (ir + 4) <= limit; ir += 4) {
      88                 :            :                                         dv = *((u32 *)ir);
      89                 :            :                                         if (dv) {
      90                 :            : #  if defined(__LITTLE_ENDIAN)
      91                 :            :                                                 ir += __builtin_ctz(dv) >> 3;
      92                 :            : #  elif defined(__BIG_ENDIAN)
      93                 :            :                                                 ir += __builtin_clz(dv) >> 3;
      94                 :            : #  else
      95                 :            : #    error "missing endian definition"
      96                 :            : #  endif
      97                 :            :                                                 break;
      98                 :            :                                         }
      99                 :            :                                 }
     100                 :            :                         }
     101                 :            : #endif
     102   [ #  #  #  # ]:          0 :                         while (likely(ir < limit) && unlikely(*ir == 0))
     103                 :          0 :                                 ir++;
     104                 :          0 :                         run_length = ir - ip;
     105                 :          0 :                         if (run_length > MAX_ZERO_RUN_LENGTH)
     106                 :            :                                 run_length = MAX_ZERO_RUN_LENGTH;
     107                 :            :                 } else {
     108                 :          0 :                         t = ((dv * 0x1824429d) >> (32 - D_BITS)) & D_MASK;
     109                 :          0 :                         m_pos = in + dict[t];
     110                 :          0 :                         dict[t] = (lzo_dict_t) (ip - in);
     111         [ #  # ]:          0 :                         if (unlikely(dv != get_unaligned_le32(m_pos)))
     112                 :          0 :                                 goto literal;
     113                 :            :                 }
     114                 :            : 
     115                 :          0 :                 ii -= ti;
     116                 :          0 :                 ti = 0;
     117                 :          0 :                 t = ip - ii;
     118         [ #  # ]:          0 :                 if (t != 0) {
     119         [ #  # ]:          0 :                         if (t <= 3) {
     120                 :          0 :                                 op[*state_offset] |= t;
     121                 :          0 :                                 COPY4(op, ii);
     122                 :          0 :                                 op += t;
     123         [ #  # ]:          0 :                         } else if (t <= 16) {
     124                 :          0 :                                 *op++ = (t - 3);
     125                 :          0 :                                 COPY8(op, ii);
     126                 :          0 :                                 COPY8(op + 8, ii + 8);
     127                 :          0 :                                 op += t;
     128                 :            :                         } else {
     129         [ #  # ]:          0 :                                 if (t <= 18) {
     130                 :          0 :                                         *op++ = (t - 3);
     131                 :            :                                 } else {
     132                 :          0 :                                         size_t tt = t - 18;
     133                 :          0 :                                         *op++ = 0;
     134         [ #  # ]:          0 :                                         while (unlikely(tt > 255)) {
     135                 :          0 :                                                 tt -= 255;
     136                 :          0 :                                                 *op++ = 0;
     137                 :            :                                         }
     138                 :          0 :                                         *op++ = tt;
     139                 :            :                                 }
     140                 :          0 :                                 do {
     141         [ #  # ]:          0 :                                         COPY8(op, ii);
     142                 :          0 :                                         COPY8(op + 8, ii + 8);
     143                 :          0 :                                         op += 16;
     144                 :          0 :                                         ii += 16;
     145                 :          0 :                                         t -= 16;
     146         [ #  # ]:          0 :                                 } while (t >= 16);
     147         [ #  # ]:          0 :                                 if (t > 0) do {
     148                 :          0 :                                         *op++ = *ii++;
     149         [ #  # ]:          0 :                                 } while (--t > 0);
     150                 :            :                         }
     151                 :            :                 }
     152                 :            : 
     153         [ #  # ]:          0 :                 if (unlikely(run_length)) {
     154                 :          0 :                         ip += run_length;
     155                 :          0 :                         run_length -= MIN_ZERO_RUN_LENGTH;
     156                 :          0 :                         put_unaligned_le32((run_length << 21) | 0xfffc18
     157                 :          0 :                                            | (run_length & 0x7), op);
     158                 :          0 :                         op += 4;
     159                 :          0 :                         run_length = 0;
     160                 :          0 :                         *state_offset = -3;
     161                 :          0 :                         goto finished_writing_instruction;
     162                 :            :                 }
     163                 :            : 
     164                 :          0 :                 m_len = 4;
     165                 :            :                 {
     166                 :            : #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ64)
     167                 :          0 :                 u64 v;
     168         [ #  # ]:          0 :                 v = get_unaligned((const u64 *) (ip + m_len)) ^
     169                 :            :                     get_unaligned((const u64 *) (m_pos + m_len));
     170         [ #  # ]:          0 :                 if (unlikely(v == 0)) {
     171                 :          0 :                         do {
     172                 :          0 :                                 m_len += 8;
     173         [ #  # ]:          0 :                                 v = get_unaligned((const u64 *) (ip + m_len)) ^
     174                 :          0 :                                     get_unaligned((const u64 *) (m_pos + m_len));
     175         [ #  # ]:          0 :                                 if (unlikely(ip + m_len >= ip_end))
     176                 :          0 :                                         goto m_len_done;
     177         [ #  # ]:          0 :                         } while (v == 0);
     178                 :            :                 }
     179                 :            : #  if defined(__LITTLE_ENDIAN)
     180                 :          0 :                 m_len += (unsigned) __builtin_ctzll(v) / 8;
     181                 :            : #  elif defined(__BIG_ENDIAN)
     182                 :            :                 m_len += (unsigned) __builtin_clzll(v) / 8;
     183                 :            : #  else
     184                 :            : #    error "missing endian definition"
     185                 :            : #  endif
     186                 :            : #elif defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ32)
     187                 :            :                 u32 v;
     188                 :            :                 v = get_unaligned((const u32 *) (ip + m_len)) ^
     189                 :            :                     get_unaligned((const u32 *) (m_pos + m_len));
     190                 :            :                 if (unlikely(v == 0)) {
     191                 :            :                         do {
     192                 :            :                                 m_len += 4;
     193                 :            :                                 v = get_unaligned((const u32 *) (ip + m_len)) ^
     194                 :            :                                     get_unaligned((const u32 *) (m_pos + m_len));
     195                 :            :                                 if (v != 0)
     196                 :            :                                         break;
     197                 :            :                                 m_len += 4;
     198                 :            :                                 v = get_unaligned((const u32 *) (ip + m_len)) ^
     199                 :            :                                     get_unaligned((const u32 *) (m_pos + m_len));
     200                 :            :                                 if (unlikely(ip + m_len >= ip_end))
     201                 :            :                                         goto m_len_done;
     202                 :            :                         } while (v == 0);
     203                 :            :                 }
     204                 :            : #  if defined(__LITTLE_ENDIAN)
     205                 :            :                 m_len += (unsigned) __builtin_ctz(v) / 8;
     206                 :            : #  elif defined(__BIG_ENDIAN)
     207                 :            :                 m_len += (unsigned) __builtin_clz(v) / 8;
     208                 :            : #  else
     209                 :            : #    error "missing endian definition"
     210                 :            : #  endif
     211                 :            : #else
     212                 :            :                 if (unlikely(ip[m_len] == m_pos[m_len])) {
     213                 :            :                         do {
     214                 :            :                                 m_len += 1;
     215                 :            :                                 if (ip[m_len] != m_pos[m_len])
     216                 :            :                                         break;
     217                 :            :                                 m_len += 1;
     218                 :            :                                 if (ip[m_len] != m_pos[m_len])
     219                 :            :                                         break;
     220                 :            :                                 m_len += 1;
     221                 :            :                                 if (ip[m_len] != m_pos[m_len])
     222                 :            :                                         break;
     223                 :            :                                 m_len += 1;
     224                 :            :                                 if (ip[m_len] != m_pos[m_len])
     225                 :            :                                         break;
     226                 :            :                                 m_len += 1;
     227                 :            :                                 if (ip[m_len] != m_pos[m_len])
     228                 :            :                                         break;
     229                 :            :                                 m_len += 1;
     230                 :            :                                 if (ip[m_len] != m_pos[m_len])
     231                 :            :                                         break;
     232                 :            :                                 m_len += 1;
     233                 :            :                                 if (ip[m_len] != m_pos[m_len])
     234                 :            :                                         break;
     235                 :            :                                 m_len += 1;
     236                 :            :                                 if (unlikely(ip + m_len >= ip_end))
     237                 :            :                                         goto m_len_done;
     238                 :            :                         } while (ip[m_len] == m_pos[m_len]);
     239                 :            :                 }
     240                 :            : #endif
     241                 :            :                 }
     242                 :          0 : m_len_done:
     243                 :            : 
     244                 :          0 :                 m_off = ip - m_pos;
     245                 :          0 :                 ip += m_len;
     246         [ #  # ]:          0 :                 if (m_len <= M2_MAX_LEN && m_off <= M2_MAX_OFFSET) {
     247                 :          0 :                         m_off -= 1;
     248                 :          0 :                         *op++ = (((m_len - 1) << 5) | ((m_off & 7) << 2));
     249                 :          0 :                         *op++ = (m_off >> 3);
     250         [ #  # ]:          0 :                 } else if (m_off <= M3_MAX_OFFSET) {
     251                 :          0 :                         m_off -= 1;
     252         [ #  # ]:          0 :                         if (m_len <= M3_MAX_LEN)
     253                 :          0 :                                 *op++ = (M3_MARKER | (m_len - 2));
     254                 :            :                         else {
     255                 :          0 :                                 m_len -= M3_MAX_LEN;
     256                 :          0 :                                 *op++ = M3_MARKER | 0;
     257         [ #  # ]:          0 :                                 while (unlikely(m_len > 255)) {
     258                 :          0 :                                         m_len -= 255;
     259                 :          0 :                                         *op++ = 0;
     260                 :            :                                 }
     261                 :          0 :                                 *op++ = (m_len);
     262                 :            :                         }
     263                 :          0 :                         *op++ = (m_off << 2);
     264                 :          0 :                         *op++ = (m_off >> 6);
     265                 :            :                 } else {
     266                 :          0 :                         m_off -= 0x4000;
     267         [ #  # ]:          0 :                         if (m_len <= M4_MAX_LEN)
     268                 :          0 :                                 *op++ = (M4_MARKER | ((m_off >> 11) & 8)
     269                 :          0 :                                                 | (m_len - 2));
     270                 :            :                         else {
     271                 :          0 :                                 m_len -= M4_MAX_LEN;
     272                 :          0 :                                 *op++ = (M4_MARKER | ((m_off >> 11) & 8));
     273         [ #  # ]:          0 :                                 while (unlikely(m_len > 255)) {
     274                 :          0 :                                         m_len -= 255;
     275                 :          0 :                                         *op++ = 0;
     276                 :            :                                 }
     277                 :          0 :                                 *op++ = (m_len);
     278                 :            :                         }
     279                 :          0 :                         *op++ = (m_off << 2);
     280                 :          0 :                         *op++ = (m_off >> 6);
     281                 :            :                 }
     282                 :          0 :                 *state_offset = -2;
     283                 :          0 : finished_writing_instruction:
     284                 :          0 :                 ii = ip;
     285                 :          0 :                 goto next;
     286                 :            :         }
     287                 :          0 :         *out_len = op - out;
     288                 :          0 :         return in_end - (ii - ti);
     289                 :            : }
     290                 :            : 
     291                 :          0 : int lzogeneric1x_1_compress(const unsigned char *in, size_t in_len,
     292                 :            :                      unsigned char *out, size_t *out_len,
     293                 :            :                      void *wrkmem, const unsigned char bitstream_version)
     294                 :            : {
     295                 :          0 :         const unsigned char *ip = in;
     296                 :          0 :         unsigned char *op = out;
     297                 :          0 :         unsigned char *data_start;
     298                 :          0 :         size_t l = in_len;
     299                 :          0 :         size_t t = 0;
     300                 :          0 :         signed char state_offset = -2;
     301                 :          0 :         unsigned int m4_max_offset;
     302                 :            : 
     303                 :            :         // LZO v0 will never write 17 as first byte (except for zero-length
     304                 :            :         // input), so this is used to version the bitstream
     305         [ #  # ]:          0 :         if (bitstream_version > 0) {
     306                 :          0 :                 *op++ = 17;
     307                 :          0 :                 *op++ = bitstream_version;
     308                 :          0 :                 m4_max_offset = M4_MAX_OFFSET_V1;
     309                 :            :         } else {
     310                 :            :                 m4_max_offset = M4_MAX_OFFSET_V0;
     311                 :            :         }
     312                 :            : 
     313                 :          0 :         data_start = op;
     314                 :            : 
     315         [ #  # ]:          0 :         while (l > 20) {
     316                 :          0 :                 size_t ll = l <= (m4_max_offset + 1) ? l : (m4_max_offset + 1);
     317                 :          0 :                 uintptr_t ll_end = (uintptr_t) ip + ll;
     318         [ #  # ]:          0 :                 if ((ll_end + ((t + ll) >> 5)) <= ll_end)
     319                 :            :                         break;
     320                 :          0 :                 BUILD_BUG_ON(D_SIZE * sizeof(lzo_dict_t) > LZO1X_1_MEM_COMPRESS);
     321                 :          0 :                 memset(wrkmem, 0, D_SIZE * sizeof(lzo_dict_t));
     322                 :          0 :                 t = lzo1x_1_do_compress(ip, ll, op, out_len, t, wrkmem,
     323                 :            :                                         &state_offset, bitstream_version);
     324                 :          0 :                 ip += ll;
     325                 :          0 :                 op += *out_len;
     326                 :          0 :                 l  -= ll;
     327                 :            :         }
     328                 :          0 :         t += l;
     329                 :            : 
     330         [ #  # ]:          0 :         if (t > 0) {
     331                 :          0 :                 const unsigned char *ii = in + in_len - t;
     332                 :            : 
     333         [ #  # ]:          0 :                 if (op == data_start && t <= 238) {
     334                 :          0 :                         *op++ = (17 + t);
     335         [ #  # ]:          0 :                 } else if (t <= 3) {
     336                 :          0 :                         op[state_offset] |= t;
     337         [ #  # ]:          0 :                 } else if (t <= 18) {
     338                 :          0 :                         *op++ = (t - 3);
     339                 :            :                 } else {
     340                 :          0 :                         size_t tt = t - 18;
     341                 :          0 :                         *op++ = 0;
     342         [ #  # ]:          0 :                         while (tt > 255) {
     343                 :          0 :                                 tt -= 255;
     344                 :          0 :                                 *op++ = 0;
     345                 :            :                         }
     346                 :          0 :                         *op++ = tt;
     347                 :            :                 }
     348         [ #  # ]:          0 :                 if (t >= 16) do {
     349         [ #  # ]:          0 :                         COPY8(op, ii);
     350                 :          0 :                         COPY8(op + 8, ii + 8);
     351                 :          0 :                         op += 16;
     352                 :          0 :                         ii += 16;
     353                 :          0 :                         t -= 16;
     354         [ #  # ]:          0 :                 } while (t >= 16);
     355         [ #  # ]:          0 :                 if (t > 0) do {
     356                 :          0 :                         *op++ = *ii++;
     357         [ #  # ]:          0 :                 } while (--t > 0);
     358                 :            :         }
     359                 :            : 
     360                 :          0 :         *op++ = M4_MARKER | 1;
     361                 :          0 :         *op++ = 0;
     362                 :          0 :         *op++ = 0;
     363                 :            : 
     364                 :          0 :         *out_len = op - out;
     365                 :          0 :         return LZO_E_OK;
     366                 :            : }
     367                 :            : 
     368                 :          0 : int lzo1x_1_compress(const unsigned char *in, size_t in_len,
     369                 :            :                      unsigned char *out, size_t *out_len,
     370                 :            :                      void *wrkmem)
     371                 :            : {
     372                 :          0 :         return lzogeneric1x_1_compress(in, in_len, out, out_len, wrkmem, 0);
     373                 :            : }
     374                 :            : 
     375                 :          0 : int lzorle1x_1_compress(const unsigned char *in, size_t in_len,
     376                 :            :                      unsigned char *out, size_t *out_len,
     377                 :            :                      void *wrkmem)
     378                 :            : {
     379                 :          0 :         return lzogeneric1x_1_compress(in, in_len, out, out_len,
     380                 :            :                                        wrkmem, LZO_VERSION);
     381                 :            : }
     382                 :            : 
     383                 :            : EXPORT_SYMBOL_GPL(lzo1x_1_compress);
     384                 :            : EXPORT_SYMBOL_GPL(lzorle1x_1_compress);
     385                 :            : 
     386                 :            : MODULE_LICENSE("GPL");
     387                 :            : MODULE_DESCRIPTION("LZO1X-1 Compressor");

Generated by: LCOV version 1.14