LCOV - code coverage report
Current view: top level - arch/x86/lib - csum-partial_64.c (source / functions) Hit Total Coverage
Test: combined.info Lines: 35 59 59.3 %
Date: 2022-03-28 15:32:58 Functions: 2 3 66.7 %
Branches: 15 28 53.6 %

           Branch data     Line data    Source code
       1                 :            : // SPDX-License-Identifier: GPL-2.0
       2                 :            : /*
       3                 :            :  * arch/x86_64/lib/csum-partial.c
       4                 :            :  *
       5                 :            :  * This file contains network checksum routines that are better done
       6                 :            :  * in an architecture-specific manner due to speed.
       7                 :            :  */
       8                 :            :  
       9                 :            : #include <linux/compiler.h>
      10                 :            : #include <linux/export.h>
      11                 :            : #include <asm/checksum.h>
      12                 :            : 
      13                 :          0 : static inline unsigned short from32to16(unsigned a) 
      14                 :            : {
      15                 :          0 :         unsigned short b = a >> 16; 
      16                 :          0 :         asm("addw %w2,%w0\n\t"
      17                 :            :             "adcw $0,%w0\n" 
      18                 :            :             : "=r" (b)
      19                 :            :             : "0" (b), "r" (a));
      20                 :          0 :         return b;
      21                 :            : }
      22                 :            : 
      23                 :            : /*
      24                 :            :  * Do a 64-bit checksum on an arbitrary memory area.
      25                 :            :  * Returns a 32bit checksum.
      26                 :            :  *
      27                 :            :  * This isn't as time critical as it used to be because many NICs
      28                 :            :  * do hardware checksumming these days.
      29                 :            :  * 
      30                 :            :  * Things tried and found to not make it faster:
      31                 :            :  * Manual Prefetching
      32                 :            :  * Unrolling to an 128 bytes inner loop.
      33                 :            :  * Using interleaving with more registers to break the carry chains.
      34                 :            :  */
      35                 :        756 : static unsigned do_csum(const unsigned char *buff, unsigned len)
      36                 :            : {
      37                 :        756 :         unsigned odd, count;
      38                 :        756 :         unsigned long result = 0;
      39                 :            : 
      40         [ +  - ]:        756 :         if (unlikely(len == 0))
      41                 :            :                 return result; 
      42                 :        756 :         odd = 1 & (unsigned long) buff;
      43         [ -  + ]:        756 :         if (unlikely(odd)) {
      44                 :          0 :                 result = *buff << 8;
      45                 :          0 :                 len--;
      46                 :          0 :                 buff++;
      47                 :            :         }
      48                 :        756 :         count = len >> 1;         /* nr of 16-bit words.. */
      49         [ +  - ]:        756 :         if (count) {
      50         [ -  + ]:        756 :                 if (2 & (unsigned long) buff) {
      51                 :          0 :                         result += *(unsigned short *)buff;
      52                 :          0 :                         count--;
      53                 :          0 :                         len -= 2;
      54                 :          0 :                         buff += 2;
      55                 :            :                 }
      56                 :        756 :                 count >>= 1;              /* nr of 32-bit words.. */
      57         [ +  - ]:        756 :                 if (count) {
      58                 :        756 :                         unsigned long zero;
      59                 :        756 :                         unsigned count64;
      60         [ -  + ]:        756 :                         if (4 & (unsigned long) buff) {
      61                 :          0 :                                 result += *(unsigned int *) buff;
      62                 :          0 :                                 count--;
      63                 :          0 :                                 len -= 4;
      64                 :          0 :                                 buff += 4;
      65                 :            :                         }
      66                 :        756 :                         count >>= 1;      /* nr of 64-bit words.. */
      67                 :            : 
      68                 :            :                         /* main loop using 64byte blocks */
      69                 :        756 :                         zero = 0;
      70                 :        756 :                         count64 = count >> 3;
      71         [ -  + ]:        756 :                         while (count64) { 
      72                 :          0 :                                 asm("addq 0*8(%[src]),%[res]\n\t"
      73                 :            :                                     "adcq 1*8(%[src]),%[res]\n\t"
      74                 :            :                                     "adcq 2*8(%[src]),%[res]\n\t"
      75                 :            :                                     "adcq 3*8(%[src]),%[res]\n\t"
      76                 :            :                                     "adcq 4*8(%[src]),%[res]\n\t"
      77                 :            :                                     "adcq 5*8(%[src]),%[res]\n\t"
      78                 :            :                                     "adcq 6*8(%[src]),%[res]\n\t"
      79                 :            :                                     "adcq 7*8(%[src]),%[res]\n\t"
      80                 :            :                                     "adcq %[zero],%[res]"
      81                 :            :                                     : [res] "=r" (result)
      82                 :            :                                     : [src] "r" (buff), [zero] "r" (zero),
      83                 :            :                                     "[res]" (result));
      84                 :          0 :                                 buff += 64;
      85                 :          0 :                                 count64--;
      86                 :            :                         }
      87                 :            : 
      88                 :            :                         /* last up to 7 8byte blocks */
      89                 :        756 :                         count %= 8; 
      90         [ +  + ]:       3024 :                         while (count) { 
      91                 :       2268 :                                 asm("addq %1,%0\n\t"
      92                 :            :                                     "adcq %2,%0\n" 
      93                 :            :                                             : "=r" (result)
      94                 :            :                                     : "m" (*(unsigned long *)buff), 
      95                 :            :                                     "r" (zero),  "0" (result));
      96                 :       2268 :                                 --count; 
      97                 :       2268 :                                 buff += 8;
      98                 :            :                         }
      99         [ +  - ]:        756 :                         result = add32_with_carry(result>>32,
     100                 :            :                                                   result&0xffffffff); 
     101                 :            : 
     102         [ +  - ]:        756 :                         if (len & 4) {
     103                 :        756 :                                 result += *(unsigned int *) buff;
     104                 :        756 :                                 buff += 4;
     105                 :            :                         }
     106                 :            :                 }
     107         [ -  + ]:        756 :                 if (len & 2) {
     108                 :          0 :                         result += *(unsigned short *) buff;
     109                 :          0 :                         buff += 2;
     110                 :            :                 }
     111                 :            :         }
     112         [ +  - ]:        756 :         if (len & 1)
     113                 :        756 :                 result += *buff;
     114         [ -  + ]:        756 :         result = add32_with_carry(result>>32, result & 0xffffffff); 
     115         [ -  + ]:        756 :         if (unlikely(odd)) { 
     116                 :          0 :                 result = from32to16(result);
     117                 :          0 :                 result = ((result >> 8) & 0xff) | ((result & 0xff) << 8);
     118                 :            :         }
     119                 :        756 :         return result;
     120                 :            : }
     121                 :            : 
     122                 :            : /*
     123                 :            :  * computes the checksum of a memory block at buff, length len,
     124                 :            :  * and adds in "sum" (32-bit)
     125                 :            :  *
     126                 :            :  * returns a 32-bit number suitable for feeding into itself
     127                 :            :  * or csum_tcpudp_magic
     128                 :            :  *
     129                 :            :  * this function must be called with even lengths, except
     130                 :            :  * for the last fragment, which may be odd
     131                 :            :  *
     132                 :            :  * it's best to have buff aligned on a 64-bit boundary
     133                 :            :  */
     134                 :        756 : __wsum csum_partial(const void *buff, int len, __wsum sum)
     135                 :            : {
     136                 :        756 :         return (__force __wsum)add32_with_carry(do_csum(buff, len),
     137                 :            :                                                 (__force u32)sum);
     138                 :            : }
     139                 :            : EXPORT_SYMBOL(csum_partial);
     140                 :            : 
     141                 :            : /*
     142                 :            :  * this routine is used for miscellaneous IP-like checksums, mainly
     143                 :            :  * in icmp.c
     144                 :            :  */
     145                 :          0 : __sum16 ip_compute_csum(const void *buff, int len)
     146                 :            : {
     147                 :          0 :         return csum_fold(csum_partial(buff,len,0));
     148                 :            : }
     149                 :            : EXPORT_SYMBOL(ip_compute_csum);
     150                 :            : 

Generated by: LCOV version 1.14